18内含子保留事件中不断变化的范式和调控方式
Last updated
Last updated
总的来说调控IR分为两个层面
intron retention 事件内在水平
intron序列上的保守性
intron GC碱基含量
intron retention 事件外在水平
DNA水平上的修饰
组蛋白水平上的修饰
内含子保留IR事件作为可变剪切的一种形式,在哺乳动物的研究中一直被忽视,虽然它在植物、真菌和昆虫中被广泛的研究。一般性的认为错误的剪切方式产生的内含子保留,在生理上是没有意义的或者是通过产生无意义的转录本来减少基因的表达。而最近的研究发现IR在疾病相关的生物学过程中发挥着重要的作用。关键性的技术难题被突破之后,使得能够强有力的对IR事件进行检测和量化。但是对于顺式和反式调节因子在其中扮演的调节作用仍旧是未知的。内含子被保留或者被剪切,受到多种内在的或者外在的因子影响和多种水平的调节。这些因素共同改变转录本剪切过程,并且为进一步理解转录调控提供新的见解。文章主要探讨了调控IR的方式以及如何去鉴定IR的方法;主要关注的是哺乳动物中的研究,同时也会拓展到一些非哺乳动物中。
最开始的设想是,一个基因编码一个多肽,也就是在人类研究中著名的ENCODE计划。Richard J. Roberts and Philip A 这两个人发现了mRNA的剪切,之后经历了40多年的发展,认为转录过程中内含子的剪切在调控基因的表达过程中扮演者重要的作用。这种对前体mRNA可变的处理机制,也改变了人们对于如何定义基因、蛋白质的观念。在这过程中,编码蛋白质或者不编码蛋白质的基因片段,被选择性的跳过或者连接起来,进一步改变了转录组和蛋白组的复杂性。在最近的研究中也发现,超过95%的多外显子基因被认为至少能够产生2个可变的转录本,表明AS在正常的生命活动中扮演着重要的作用。
可变剪切AS的类型主要包括
外显子跳跃 ES
可变的5‘
可变的3’
内含子保留
多个外显子互斥
一直以来IR事件在概念上被误导,认为是剪切复合体和相关因子的异常而导致的结果。因此IR在哺乳动物的研究中一直被忽视,知道最近才被重视起来。许多内含子就包含提前终止的密码子,导致在细胞质中被监管机制降解。还有一种方式就是micorRNa诱导的mRNA切割,这个机制仍旧需要实验的验证。IR的转录本与核糖体亚基互作产生新的功能的蛋白质。还有一种IR 的isform被保留在细胞核中,也被称作ID,同样能够被一些核孔蛋白诱导降解。ID转录本被存储在细胞核中,当受到外界刺激时能够快速的释放到细胞质中,使得细胞做出响应。在植物中IR是最频繁的剪切事件,而在人类中ES是最频繁的事件。在拟南芥中大约有3分之2的剪切事件是IR;并且IR的isform转录本的命运与动物中是差不多的;但是在植物中大多数的IR转录本是不包含提前的终止密码子的,因此会逃避掉被降解的命运。因此这个IR在植物中可能和某种特定的功能存在联系,例如IR在植物正常的发育和逆境响应中扮演着重要的作用。IR产生的转录本有利于减少重新翻译所需要的成本,并且通过选择性的翻译某种蛋白来适应各种压力条件。在植物授粉和开花中,PMEI发生IR来产生恰当的表达水平来维持正常发生长发育。
在单个细胞的转录组研究中,酵母中含有2200多个含有内含子的基因,这些基因中发生的主要是IR事件,同时这些IR事件也是相互关联的,说明多种IR事件协调地调控酵母细胞的减数分裂。IR作为转录后的一种调控方式,对于维持酵母细胞的正常生长是至关重要的。IR作为在动物不同发育阶段产生不同的基因表达和转录组一种调控机制。
在不同类型的细胞中IR的频率也是不一样的说明,IR可能作为一种调控基因表达的方式。例如在肌肉、胚胎干细胞中IR的频率就比较低而在神经元和免疫细胞中IR频率就高,在神经元细胞中,IR事件能够促进细胞在接收到外界信号时短时间的合成蛋白质,相比于从头开始转录、翻译的方式。在胚胎干细胞向神经元细胞分化的过程中,IR介导一些与神经元特定功能的基因上调表达,而参调控细胞周期的基因下调表达。 在受精后,稳定的ID isform相对于 Constitutive isform有更长的半衰期,ID isform被招募到核糖体上,翻译对应的蛋白质。
在各种疾病中报道了一些异常的IR事件,这些isform的产生通常是由于精细胞或者体细胞中剪切位点发生突变导致的。剪切位点的突变往往会导致部分或者完全的IR事件发生,导致抑癌基因的失活。剪切位点的缺陷往往会导致IR事件的频繁发生,尤其是那些比较弱的剪切位点。但是对TCGA数据库中的数据分析发现,即使在剪切位点处没有突变的发生,仍旧还是有大量的IR发生。这也表明IR事件不仅仅受到单个因素的调控,而是受到一些顺式和反式因子之间的复杂调控机制。
the characterization of such features has been examined in many global gene regulation studies (16,17,46,51).
在一些研究中,顺式序列的特征通过阻碍剪切复合体识别内含子来影响内含子保留。在人类中通过加强内含子两侧的次要剪切位点,能够促进高度保留的内含子的剪切。在植物和细菌中,IR事件通常和weak splice sites存在一定的联系
IR has also been shown to be associated with weak splice sites in plants, fungi and protists (19).
简单来说就是,剪切位点的强度的减少,使得IR事件的增加;虽然这种相关性具有一定的合理性,但是这仍旧不是唯一的原因。
被保留的内含子有更高的GC含量,相比于Constitutive spliced intron。在内含子中重复出现的GC碱基能够部分解释内含子保留的现象,在人类中高GC含量的intron能够产生高度稳定的RNA二级结构,并且GC重复序列在内含子中具有位置偏好性
They also noted a positional bias on the location of the GC repeats within introns towards splice sites (within 0.07–0.8 kb)
GC碱基诱导的RNA二级结构能够抑制 一些反式转录因子的结合,从而使得抑制内含子的剪切。同时GC含量的增加也与RNA聚合酶二的移动速度呈负相关,可能是由于复杂的DNA二级结构导致RNA聚合酶二的pausing。在基因间区和内含子区域、内含子和外显子连接处存在一些超级保守的序列。这些序列跨越了外显子和内含子连接处,并且使得RNA能够形成热力学上稳定的颈环结构。
在植物和脊椎动物中,被保留的内含子通常比剪切的内含子短.
Retained introns are generally shorter than non-retained introns in vertebrates and plants (17,51,54).
在水稻的研究中就发现,被保留的内含子长度大约在183bp,而被剪切的内含子大约470bp。
总而言之,IR序列之间通常共享一些特征,短的内含子长度、高的GC含量。内含子越短,其中包含motif(用于结合剪切因子)的几率就更加小了;同时被保留的内含子内的序列特征在不同组织间也并不是一致的。
Notably, sequence feature analysis of retained and constitutivelyspliced introns in Arabidopsis thaliana has shown that most retained introns display weaker 5 sites, less PTC occurrence and lower GC content (66) ,低GC含量这就与上面提到的一些特征不一样了。
通过对1000最频繁和最不频繁的IR进行分析,发现富集到有蛋白结合位点。内含子结合SR蛋白能够促进内含子的剪切,但是exon上结合hnRNPLL时,反而促进内含子的保留。
serine-arginine (SR) protein binding sites was observed in retained introns.
在Gr中,就有40%左右的AS事件是IR,IR中的43%有转座子,但是在所有的intron水平来看的话这个水平只有2.9%。转座子的插入往往是靠近内含子的3‘剪切位点,可能是通过减少RNA二级结构来影响内含子的剪切效率。
The features include the presence of weaker splice sites, a higher GC content, a shorter intronic length, and a consistent trend for the retained introns to be located near the 3 termini of the gene body
Epigenetic changes including DNA methylation and histone modifications are known to regulate alternative splicing (75–79).
保留的内含子通常含有更加高密度的CpG碱基,相比于不保留的intron。蛋白质通过识别DNA甲基化位置被招募到mRNA附近,进行mRNA的加工。
Post-translational modifications of lysine 36 in histone 3, particularly H3K36me3, have consistently been associated with IR in plants and mammals (77–90).
翻译后的修饰同样与IR事件存在关系,编码H3K36me3甲基化的基因受损后,减少了IR事件的发生。
In rice, the depletion of SDG725, a plant-specific H3K36 methyltransferase, alters dramatically the patterns of IR by affecting >4700 genes (89)
SDG725 knock-down 之后基因5‘区域的IR事件增加而3’区域的IR减少可能是由于组蛋白修饰既能够招募一些剪切促进因子同时也能够招募一些剪切抑制因子。
Previous studies have reported that H3K36me3 regulates the recruitment of either a splicing enhancer or a repressor (91,92).
染色质的可及性与IR同样存在关联,在拟南芥个水稻中发现IR高度富集在DNAse I敏感位点附近。保留的内含子通常表现出更开放的染色质状态,使得剪切复合体有更少的时间去处理这个intron。
要分析调控IR的因子,首先需要做的就是如何区分不同的IR事件。
IR受到多个级别的调节,其中具体的分子机制仍旧有待进一步的阐明。
在饥饿状态下,已经被剪切的内含子会干扰其他内含子的剪切从而减少能量的消耗,
The changing paradigm of intron retention: regulation,
ramifications and recipes