20可变剪切的进化

Abstract

人类中基因的平均长度大约在28000个核苷酸,每个基因约8.8个外显子,每个外显子长度约为120bp,被7.8个内含子间隔开。虽然外显子相对于内含子很小,但是剪切机制仍旧能够精确的识别外显子,剪切掉内含子,形成成熟的mRNA。每个基因如此多的外显子,也使得剪切机制能够在单个基因上剪切不同的exon,产生不同的mRNA。在人类中大约有~26000个基因复杂编码90000多个蛋白质。

对于可变剪切的起源,最近提出的两个假说:

  1. 基于序列水平

  2. 基于反式因子

作者这里提出由于祖先5‘剪切位点的累计突变使得这个剪切位点进一步的优化,能够产生可变的转录本。

进化的overview

​ 真核生物基因家族中大多数的内含子不是起源于最近的祖先基因,而是在进化的过程中随后获得的,这也使得形成了多个内含子的基因。所以这个多内含子基因的出现可能早于可变剪切的出现,组成型剪切的出现可能早于外显子跳跃。因此可变剪切的出现是起源于当时那些没有可变剪切的多内含子基因。

​ 虽然内含子在大多数真核生物的基因组中都存在,但是可变剪切在多细胞生物中更加普遍。在酵母细胞中大约只有3%的基因包含内含子,只有6个基因包含2个内含子。但在另外一种酵母中,约有43%的基因包含内含子,并且许多基因包含多个内含子;但是在这些生物中却没有可变剪切。通过比较基因组学数据发现,在不同的生物中序列水平上的保守性,表明这个精力了净化选择,可能有重要的功能。

可变剪切的进化模型

第一种强调DNA水平上的突变:

DNA突变产生的weak splice site 将会使得剪切机制跳过内部的exon;这种方式在不影响基因产生原始转录本的情况下能够产生一些具有新的功能的转录本。研究就表明可变的外显子拥有weak splice site 使得剪切机制不能够很好的识别。

第二种机制强调剪切调控因子的进化

SR PROTEINShnRNP

例如SR 蛋白通过结合到 contitutively splice exon上,弱化选择亚,使得这些exon附近的剪切位点能够发生突变形成weak splice site。这两个模型并不存在冲突,第二种模型还只是一个猜想没有很多实验的证明。

内含子剪切的原理

内含子包含四种短的序列

  1. 5’剪切位点

  2. 3’剪切位点

  3. 位于3‘剪切位点上游的分支位点

  4. 位于分支位点和3’剪切位点中的多嘧啶区域

剪切复合体的定义

随着研究的进行,越来越多的剪切复合体蛋白被发现

All types of premRNA splicing take place within the spliceosome — a large complex composed of five small nuclear RNA (snRNA) molecules (U1, U2, U4, U5 and U6 snRNA) and as many as 150 proteins16–18. Each of the five snRNAs assemble with proteins to form small nuclear ribonuclear protein complexes (snRNP).A coordinated binding of the five snRNPs with the splice signals of the premRNA results in the removal of each intron and the ligation of the flanking exons

内含子和外显子中都包含有一些短的供剪切调节蛋白(外显子识别增强子、抑制子,内含子识别增强子、抑制子)识别的结合位点。

mRNA的剪切也似乎被两种机制所调控:RNA聚合酶2控制的mRNA的转录基因和转录因子控制细胞时间和空间上的变化。

关于生物中内含子识别还是外显子识别

内含子识别的话允许剪切一些大的exon片段,而外显子识别对应剪切下的exon通常都很小。

ID seems to be the ancient mechanism that allows the recognition of introns embedded in large exonic sequences, which is the case for most of the introns in lower eukaryotic cells27,31.

The ED mechanism can identify relatively short exon sequences (~120 nucleotides) located within large intron sequences,which is the case for most of the exons in higher eukaryotic cells

AS剪切类型示意图

可变剪切exon的特征

可变的exon与Constitutive exon在一些特征上存在差异。

在EonSkip事件中,外显子两侧的内含子区域都很保守,这些保守的内含子序列就可能参与到调控可变剪切。并且他们的长度通常更小,会被3整除不会导致编码框的改变。

与反式因子的结合紧密程度

constitutively spliced mammalian 5′ss bind more tightly to U1 snRNA than alternatively spliced exons

参考

  1. HOW DID ALTERNATIVE SPLICING EVOLVE?

Last updated