# 03表观遗传与可变剪切

:ballot\_box\_with\_check: Alternative splicing && Histone modifications && DNA methylation

## 可变剪切普遍存在

![脊椎动物与无脊椎动物](https://user-images.githubusercontent.com/39325949/68446729-92960f80-0218-11ea-8968-dfbd6e5749b2.png)

在脊椎动物与无脊椎动物(线虫)中，编码蛋白质的基因大致有\~20,000个，而脊椎动物中基因发生可变剪切的数目更高，平均每个基因发生可变剪切的数目也更higher。这种现象也可能是导致脊椎动物相于无脊椎动物，机体功能和结构上更加复杂的原因之一。

* 可变剪切通常与RNA的转录耦合在一起，也就是RNA在转录的过程中同时发生着pre-mRNA的加工和修饰，加工就包括剪切复合体切除内含子，将外显子连接形成成熟的mRNA
* 在生物发育的不同阶段，不同组织以及不同物种之间可变剪切具有特异性，通过精准的调控mRNA的剪切，使得生物体正常的进行生命活动
* 一种可变剪切方式往往对应着一种具有功能的蛋白质，因此异常的可变剪切方式往往会导致一些遗传疾病和癌症的发生

这些都表明可变剪切在真核生物的遗传调控中起着重要的作用

## 可变剪切的调控机制

可变剪切通过剪切复合体**spliceosome**行使对应的功能，spliceosome通过识别剪切位点来对mRNA进行准确的切割。

![spliceosome识别exon与intron](https://user-images.githubusercontent.com/39325949/67864513-abd7f580-fb60-11e9-9c91-e244485c3e70.png)

spliceosome的组成：

* 小的核糖核蛋白**snRNPs**包括(u1 u2 u3 u4 u5)等多个亚基，通常是结合到剪切位点
* 小的核RNA**snRNAs** ，与mRNA上的顺式作用元件结合
* \~150多种其他蛋白质

spliceosome通过识别内含子或者外显子来对mRNA进行切割

* intron识别机制，通常是内含子比较短，在几百bp的范围内；主要在酵母和无脊椎动物中存在
* exon识别机制，内含子在\~1kb以上，主要存在于脊椎动物之中

### exon definite 模式

![exon definite](https://user-images.githubusercontent.com/39325949/68446743-9de93b00-0218-11ea-85c1-c2fa935d8134.jpg)

* 小核糖核蛋白U1snRNP包裹的的snRNA识别5‘剪切位点
* 小核糖核蛋白U2snRNP包裹的的snRNA识别3‘剪切位点
* SR蛋白包含一段能够识别exon的motif，结合到外显子区域,它所包含的一段富含精氨酸与丝氨酸的区域**RS**能够与U1，U2结合，帮助exon definite
* 剪切因子SF1与SF3则架起U1与U2之间的桥梁
* 之后再招募其他组成spliceosom的因子U3/U4/U5，行使内含子剪切和外显子连接的功能

## DNA甲基化调控可变剪切

DNA胞嘧啶的5号碳原子在甲基转移酶的作用下，发生甲基化；在植物和动物中，最典型的就是CpG甲基化。甲基化的位点在去甲基转移酶的作用下可以发生去甲基化，因此甲基化在不同组织和不同发育阶段往往表现是不一致的。

![甲基化类型](https://user-images.githubusercontent.com/39325949/66695515-239ac900-ecf5-11e9-93fb-a91785c0409e.png)

### CpG影响外显子的定义

通过比较CpG甲基化在外显子与两侧内含子中的水平，发现无论是在exon和两侧内含子在GC含量存在差异，核小体占有率存在差异的情况；还是两个指标都没有明显差异的情况下；都表现出外显子比两侧内含子更高的甲基化水平。这说明DNA甲基化能够作为区分exon与intron的标记

![甲基化定义exon](https://user-images.githubusercontent.com/39325949/68446752-a5a8df80-0218-11ea-9c47-b22e52c058c7.jpg)

### 甲基化调控可变剪切

* CTCT能够识别DNA中`CTCCF`motif，在RNA聚合酶转录的过程中，CTCT会使得Pol II聚合酶聚合的速度放缓，从而导致剪切复合体能够识别一些弱剪切位点，使得Alternative exon被include；当motif发生甲基化时，CTCF蛋白不能够结合到DNA上，使得Alternative exon被 exclude
* MeCP能够结合到CpG位点，招募组蛋白去乙酰化酶**HDACs**，去除组蛋白的乙酰化。组蛋白的乙酰化有利于染色质保持一个开放的状态；因为乙酰基带负电，DNA也带负电，乙酰化使得组蛋白与DNA之间结合的程度降低，从而有利于转录因子结合到DNA序列。去除乙酰化导致Pol II的延伸速率变慢，使得Alternative exon 被include
* DNA甲基化位点同时能够诱导组蛋白的H3K9me3，招募HP1蛋白，招募剪切因子SFs，使得Alternative exon 被include

![甲基化调控可变剪切](https://user-images.githubusercontent.com/39325949/68446803-c7a26200-0218-11ea-8dc7-e2da02a5319f.jpg)

## 组蛋白修饰调控可变剪切

在真核生物中，大约147bp的DNA序列被核小体包裹，核小体起着保护DNA序列不被损伤，以及限制DNA可以性的作用。通过比较发现外显子中核小体的密度显著的高于内含子，说明核小体的位置可能个exon的definite有关

核小体的组成：

* H3与H4组蛋白形成二聚体后，进一步形成四聚体
* H2A与H2B组蛋白形成二聚体后，进一步形成四聚体
* 最终形成H1、H2、H3、H4的八聚体，将DNA包裹起来
* 核小体与核小体之间通过H1组蛋白相连

![核小体结构](https://43423.oss-cn-beijing.aliyuncs.com/img/20191021111424.png)

### 组蛋白修饰

组蛋白的修饰是发生在翻译后，并且通常在蛋白质的N端发生甲基化或者乙酰化

蛋白复合物通过识别特定的组蛋白标记，影响下游的事件

![组蛋白修饰](https://user-images.githubusercontent.com/39325949/68446785-beb19080-0218-11ea-99d7-a3be4d1b5a67.jpg)

![组蛋白修饰](https://user-images.githubusercontent.com/39325949/68446779-bbb6a000-0218-11ea-9fed-e5a9a34caa91.jpg)

### 组蛋白影响可变剪切

* H3K9me2、H3K9me3甲基化招募HP1蛋白，影响RNA聚合酶 II的延伸速率，从而影响可变剪切
* 组蛋白乙酰化通过使得染色质更加开放，影响RNA聚合酶 II的延伸速率，从而影响可变剪切
* H3K36me3甲基化通过染色质相关蛋白MRG15或者Psip1，进而招募剪切因子PTB或者SRSF1，来促进Alternative exon 被exclude或者include

![组蛋白影响可变剪切](https://user-images.githubusercontent.com/39325949/67469508-dfa5ad80-f67e-11e9-8099-944930bc48e4.png)

## siRNA介导的组蛋白修饰

组蛋白修饰发生在染色质水平，而DNA的转录发生在DNA水平，是什么指导染色质对应位置发生准确的修饰从而调控DNA转录过程中mRNA准确的剪切。

长度在20\~30bp的small nocoding RNA能够指导染色质的重塑，类似于RNAi的机制。双链的RNA在Dicer酶的作用下切割成siRNA，siRNa与Ago蛋白Chp1等蛋白形成RNA介导的转录后沉默复合体**RITS**，通过siRNA与pre-mRNA结合，Chp1蛋白则与对应位置的核小体结合，介导组蛋白修饰的发生

![siRNA介导组蛋白修饰](https://user-images.githubusercontent.com/39325949/68446771-b5c0bf00-0218-11ea-808d-c5209af0295d.png)

## Conclusion

影响可变剪切的几个因素

* RNA水平上
  * PoI II 聚合酶的延伸速率
  * RNA结合蛋白**RBP**结合到pre-mRNA上进行剪切复合体的组装
* DNA水平上
* DNA甲基化与exon definite
  * DNA甲基化影响蛋白质的结合
* 染色质水平
  * 核小体与exon definite
  * 组蛋白的修饰改变染色

## 参考
