由粘连蛋白介导的人类基因组中染色体loop图谱

科学问题:

远端调控元件与基因的互作对基因的表达有着重要的作用,在不同类型的细胞中这种远端调控元件与基因的互作存在差异的,而这种差异的程度以及是否会造成不同细胞间基因的差异表达仍旧是未知

背景

染色质三维结构

TAD:作为基因组内一个基本的调节单元;促进内部的调节元件与基因发生互作而阻止与附近基因的互作。这种染色质区域化是高基因组结构和功能的重要特征。在动物和果蝇中部分TAD是在CTCF 结合位点形成一个环状的粘连蛋白复合物。作者这里想要探究粘连蛋白介导的loop在不同类型细胞中的情况及其对基因表达的影响。

方法

1.ChIA-PET技术流程

细胞经过交联后进行核裂解,切割染色质后;使用RAD21的抗体进行免疫共沉淀,复合物进行亲和纯化;之后使用带有生物素标记的接头连接纯化后的片段。添加测序接头后使用链霉亲和素将带有生物素标记的片段富集构成最终的测序文库。

改变后的流程:

ChIA-PET

在交联之后使用超声波打断,使用RAD21的抗体进行免疫共沉淀,之后添加生物素标记和测序接头;去交联后使用Tn5转座酶进行切割,使用链霉素将带有生物素标记的DNA fragment拉下来进行PCR扩增构建测序文库

2.ChIP–seq技术流程

室温下进行交联,超声波进行核裂解;使用H3K27ac的抗体进行免疫共沉淀,纯化后的片段进行建库测序

3.ATAC-seq技术流程

转座子被证明在体内会整合到调节元件中

基于转座酶实现染色质开放性程度的鉴定,一般开放的染色质区域容易被Tn5转座酶识别,转座则会优先发生在开放的染色质区域。通过在转座酶两端添加测序接头就可以在转座酶处理后进行PCR扩增就得到了对应的测序文库

转座酶

1.原始数据的处理与展示

作者这里使用RAD21这个黏着蛋白复合物,这个蛋白是促进基因和增强子之间的物理互作,对染色质loop和sub-TAD的形成有重要的作用。与此同时进行了H3K27ac的CHIP-seq,这个组蛋白修饰是划定一些活性的启动子与增强子的。

图a-b 展示的是特定区域的loop图

图c-d展示与与已发表数据的比较情况,图d是与已发表的Hi-C loop重叠比例;对应的CTCF motif的统计情况

与已发表的数据进行比较

2.细胞特异性的loop

  1. 使用PET read数目反映交互频率,用于量化loop

  2. 特异性的loop与细胞中基因的特异性表达存在关联

  3. 把基因在不同组织间的表达进行分类,分为广泛的表达和组织特异性的表达

图a中 将loop分为了两类,一类是在不同细胞间存在差异的;另一类是不存在差异

在发现有些loop在不同细胞间存在差异后,就想要去鉴定出细胞间特异性的loop;进行PCA将24种细胞分为了3类;这与RNA-seq,H3K27ac的PCA结果类似。同时发现来自同一个细胞的三个细胞在·分化后loop存在比较大的差异说明表观遗传在其中起着作用MSLCL 、MSiPS 、MSLCL 三类细胞

doDp26.png

为了对loop差异性进行量化,使用线性混合模型鉴定那些在不同细胞间交互频率存在差异的loop;最终鉴定41%的variable loop;并且差异的loop跨越的距离更短。图d和

为了研究这些差异性的loop是否与特定的基因存在关联,作者将基因也分为了两类,广泛的表达,和细胞特异性的表达。发现差异性的loop中存在更多特异性表达的基因。图f

doDnRP.png

3.特异性的loop与染色质状态间的联系

增强子通常通过与远端启动子互作调节基因的表达,因此为了研究介导增强子交互的loop,使用H3K27ac信号作为增强子信号

  1. 图a loop 末端与增强子元件区域重叠程度越大,发生交互作用的程度就越大;而启动子却相反。手动的检查发现特异性的loop区域与细胞特异性的元件例如增强子有重叠;图b

  1. 为了理解细胞特异性的loop与细胞特异性染色质状态的关系,作者列举了8种染色质状态代表,它们分别与特异性的loop有重叠;其中有23%的增强子元件与loop end重叠,图C、D

  2. 特异性的loop介导了特异性的enhancer和基因间的联系;

  3. 基因发生交互的增强子数目也与基因的表达存在关联;因此作者研究了那些通过loop将启动子与增强子连接的基因,根据增强子的数目将它们分了三类,比较它们的表达水平差异 。 图f,连接的增强子数目越多表达水平越高

4.基因的连通性对应其功能

哪些基因更容易与增强子发生互作?

接下来讨论的问题就是:一个基因与多个增强子发生互作还是一个增强子发生互作,是否是取决于基因自身的性质?

  1. 作者认为:那些表达水平会影响编码产物的基因,将会需要更多的增强子互作;这些个基因也可以被认为是剂量性基因。

为了研究这个问题:作者发现那些拷贝数不足的基因往往具有更多的loops来使得enhancer link 它们。这说明剂量效应不足的基因,往往又多了一个监管层面去调控它们。

  1. 与单倍型不足基因类似,GWAS鉴定的基因同样表现出与远端区域的连接程度更高;说明疾病相关的基因具有更广泛的调控途径。

  2. 管家基因却表现出相反的情况 图g-i

doy6ij.png

5.loop交互频率的变化与基因表达水平的变化之间的联系。

已经知道不同细胞间loop存在差异,现在想知道loop交互频率的差异是否会影响基因的表达水平。

图a 前三个细胞中存在较高的loop 交互使得基因的表达水平更高

图b 发现交互频率越高,表达水平也越1高。整体来看loop的交互频率与基因的表达水平存在一定的相关性;并且对于连接启动子与增强子的loop这个相关程度更高。图e

do68XV.png

6.组中特定的loops

经过PCA分析,将细胞分为了3大group;作者认为group特异性的loop可能与细胞命运的决定和维持有关,并且受到细胞特异性的TFS监管。

因此作者分析了所有group特异性的loops末端序列,得到了598个TFs 可能结合的motif位置。并且给出了一个例子图a

为了进一步验证这些motifs的功能性,作者对motifs处的染色质开放程度进行测定,结果表明这些motifs确实有着更高的开放程度 图b-d

细胞特异性loop与特定的生物学功能 图e

对GWAS鉴定到的一些与疾病相关的SNP是否更偏向于出现在loop末端。将GWAS的数据与loop的数据进行整合;发现一些富集细胞特异性loop的SNP。图f

使用另外一种LD score regression 同样得到类似的结果

总结:

  1. 28%的loop,它们的交互频率在不同细胞间存在差异,

  2. 细胞特异性的loop与基因的特异性表达存在联系

  3. 细胞特异性的loop可能受到表观遗传的调控

  4. 管家基因上更少的loop富集而致病基因、单倍型不足基因上更多的loop;说明这些基因有更加丰富的调控机制

  5. 全基因组关联分析发现,一些与免疫相关的变异在血液细胞特异loop富集,而在胚胎细胞中没有,说明这些loop可以帮助我们进一步理解一些疾病变异。

参考文献

  1. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position

  2. CTCF-Mediated Human 3D Genome Architecture Reveals Chromatin Topology for Transcription

  3. Three-dimensional chromatin landscapes in T cell acute lymphoblastic leukemia

  4. Principles of genome folding into topologically associating domains

  5. Landscape of cohesin-mediated chromatin loops in the human genome

Last updated