Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants

Abstract

在真核生物中,基因在RNA聚合酶II的作用下倍转录成成mRNA,其中多数时候intron是在转录的过程中被剪切复合体剪切掉。在酵母的long-read sequencing研究中发现,当聚合酶II越过内含子时,剪切随即发生。本文基于Nanopore测序技术,绘制了结合在染色质上的RNA图谱,与此同时能够在全基因组范围检测剪切状态、聚合酶II的位置、多聚腺苷酸化。通过分析发现,在聚合酶II越过3‘剪切位点1Kb后,仍旧有超过半数的intron仍旧保持未剪切的状态;相比于酵母,植物中的剪切速率慢的多。许多全长的chromatin-bound RNA在多聚腺苷化后,仍旧包含有未剪切的内含子。而这些内含子在细胞质中几乎是不存在的,对nonsense-mediate decay具有抵抗力,表明这些RNA是在转录完成后、被释放到细胞质之前完成剪切的;作者给这类intron下了一个定义,post-transcriptionally splice intron pts intron.对来自公共数据库中6500份RNA-sequencing分析后,发现pts intron的剪切依赖于剪切相关蛋白PRMT5SKIP同时又受到各种环境信号的影响。在拟南芥中大多数内含子保留事件是发生在pts introns,表明pts intron是内含子保留事件的主要来源,也可能是机体产生有功能的mRA的一种快速响应机制。

introduction

在真核生物中,pre-mRNA的剪切是mRNA成熟中一个基本的过程,并且剪切是转录往往同时进行。之前的研究通过人工合成pre-mRNA,在体外重构了剪切事件这一过程,帮助我们很好的理解了剪切位点的识别以及剪切复合体的组装。随着高通量测序技术的绘制新生RNA的图谱,极大的促进了在全基因组水平量化剪切事件,同时精准的追踪聚合酶II。但是研究剪切和转录之间的关系存在很大的困难,因为在同一个转录本上描述剪切和转录很困难。

通过long-read sequence可以发现大多数intron的剪切是在转录时发生的,当然这种现象也因组织而异。除了共转录剪切,也存在大量的转录后剪切,这些mRNA在多聚腺苷酸化后bound在染色质上。

通过对chromatin-bound RNA进行捕获后发现,处于延伸中的RNA占了70%,而多聚腺苷酸化的RNA只有30%。有了这些数据后,进一步的研究剪切和转录的关系。

NEjmOf.png

进一步对处于elongating中的full-read 分析发现,有将近20%的read,存在至少一个已经剪切的intron,而有50%的内含子,在聚合酶II跨过3’剪切位点1100bp后,仍旧没有被剪切掉。

不同颜色代表不同类型的mRNA,和对应的比例

NExRFe.png

由于文章的方法能够同时追踪来自同一个转录本的多个intron的状态,作者比较了任意两个相邻的intron的剪切顺序,发现有70%是上游的intron先发生剪切。

NVSwK1.png

进一步比较了包含多个intron 的基因转录动态过程,发现上游intron被剪切的比例更高一些,同时又一部分的上游intron已经被剪切掉了,在聚合酶II越过下游内含子时,也有一部分上游内含子在下游内含子都剪切掉的情况、多聚腺苷酸化后仍旧没有被剪切。

还存在相邻两个intron协助剪切的情况,可能是由于位于同一个transcript上的intron通过招募一些剪切复合物来帮助其他intron剪切。

柱状图中恒坐标表示第几个外显子,例如S2中当聚合酶II越过第2个内含子时,两个intron就有4中可能,对应4种比例

研究多聚腺苷酸化的transcript的剪切情况,其中有30%没有完全的剪切掉内含子,并且大多数为剪切的转录本只包含了一个或少数未剪切的intron。分析这些未完全剪切的transcript是否会从染色质上释放,

通过分析那些未剪切比例大于0,.1的transcript在细胞核和细胞质中的含量,表明这些transcript仍旧bound在chromatin上,在多聚腺苷酸化后,同时FPKM分析也表明,驻留在chromatin上的表达量相比于细胞核、细胞质中的更高。unspliced的intron如果释放到细胞质中会被NMD降解,通过upf1敲除后,没有NMD发现unspliced的含量没有变化。

当分析RNA-seq数据时,内含子错误的注释是很常见的,因此作者选择了constitutively spliced introns 进行了下一步的分析。为了研究pts intron中调控内含子剪切的因素,作者选择了6521份RNA-seq数据进行分析,其中包括一些突变体、不同调节处理的材料。其中有10份突变材料中,500个intron的保留率相比于野生型有所提高。其中就包括已经报导的PRMT5 *SKIP 两个基因。这两个基因主要是促进pts transcript 中Intron的剪切,当然对于非pts也有一定的影响。

PRMT5 is implicated in various developmental processes, such as flowering time control, stress response and circadian rhythm, by promoting the recruitment of NineTeen Complex to the spliceosome and modulating pre-mRNA splicing of diverse genes

在细胞核中保留的已经多聚腺苷酸化,但是没有完全剪切的transcript,被存储在细胞核中防止被NMD降解,可能是在机体受到环境刺激时,激活剪切机制,产生具有功能的mRNA。

Last updated