Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer

Abstract

​ 染色体通常折叠成连续多层来容纳线性的DNA。处于相同的TAD区域的基因,表现出相似的表达水平和组蛋白修饰水平,boundaries通过分隔不同的domain来维持染色体结构的稳定性。与此同时,在癌细胞中domain的破坏会导致基因表达的失调;但是domain被破坏的频率仍旧是不知道的。文章中通过对ICGCTCGA数据集中38种癌症类型的2658个癌症患者的全基因组测序中,分析288457份体细胞结构变异;来分析SVs在全基因组的分布,以及SVs对TADs的影响。结果表明SVs能够导致TADs的融合或者分离,同时复杂的重组事件显著的改变染色质折叠。仅仅只有14%的boundary deletions导致基因表达发生2倍的变化

introduction

DNA在细胞核中折叠

The role of 3D genome organization in development and cell differentiation

​ 在哺乳动物细胞中,细胞核内的DNA被包装形成染色质纤维,形成基因组的3D结构。高阶的染色质结构通常与长距离的基因调控相关,而长距离的基因调控又控制着细胞发育以及命运决定。染色质的某些区域附着在核的外围,并且形成抑制性的 lamin-associated domains LADs。而最近染色质浓缩的研究揭示,染色质折叠成不同组织间共有的TADs,并且这些TADs中的DNA的交互更加频繁。通常TADs被认为是一个功能单元,内部集齐了调控元件和基因;因此TADs完整性是保持恰当的基因调控。boundary的破话将会导致附近domain的异常交互,从而影响附近基因的表达。

​ 被劫持的增强子导致癌症相关基因的超表达,促进了癌症的形成。基因组的重排在塑造TADs结构时有着显著的功能,最终导致基因调控失调。为了解决SVs是如何影响TADs,作者通过综合的比较了不同类型的SVs在不同癌细胞中对TADs、gene表达的影响,来进一步理解癌细胞中染色质折叠和基因重组的联系。

Result

不同类型的SV影响TAD的boundary

​ 之前的研究中报道了,TADs在不同细胞组织间的差异不大。在本文用到的Pan-cancer数据中,作者想要得到多种细胞类型中共有的boundary。并且与之前的报道相比鉴定到的boundary存在84%的重叠。boundary之间的平均距离大约750kb,与之前报道的人类中的TADs大小接近。最终得到共有的2477个boundary,与之前非癌细胞中报道的boundary进行比较发现存在80%多的重叠,说明boundary在正常细胞与癌细胞中比较保守。接下来检查了CTCFbinding和DNAse I敏感位点,发现这些特征的富集,并且在boundary处耗尽;这也与boundary是减少相邻domain间的交互的功能相吻合。

实线是共有的boundary,虚线是混乱的boundary

​ 作者通过SV breakpoint对SVs进行分类;SVs又进一步分成2个亚组根据events的长度,2Mb以上称作long-range SVs还有short-range SVs;其中前3类主要分为short-range SVs而最后一类主要被分为long-range SVs。

Patterns of somatic structural variation in human cancer genomes

  • deletions

  • inversions

  • duplications

  • complex rearrangements

8GED3Q.png

​ 与随机状态下混乱的boundary相比,在duplications SVs中受到影响的boundary更富集,对应的各种SVs富集的BAs(boundary affect)比例如下:

正太分布均值为随机状态下,observe为实际观察到的

BAs的比较

​ boundary受影响的程度也存在差异,大多数SVs影响单个boundary。

体细胞中的SVs的长度往往由于负向选择压的作用与癌细胞中的SVs相比表现出更短。因此作者调整指标来筛选体细胞中的SVs,通过比较发现SVs影响boundary的比例非常稀少。

染色质构象的破坏具有组织特异性

在不同组织中,受影响的boundary与SVs存在着差异

不同组织中SVs和BAs

特定组织中的癌细胞能够反复的影响boundary

圈的大小表示sample的比例,不同颜色表示不同类型的SVs,y轴是一些标志性基因

8GAUW4.png

大多数domain的破坏不会导致mark基因表达的改变

that gene regulation in cancer genomes is multifactorial, although disruptions in chromatin folding domains may contribute to expression levels in certain cases, the effects of disruption do not always coincide with the expression changes

通过方法计算了染色质的状态,并且使用k-means将染色质状态将TADs聚类成5类

比较了活跃状态下的TAD区域与不活跃状态下TADs区域的基因表达水平

总结

  • genome organization may influence partner selection during genomic rearrangements, as suggested by the distribution of different SV types in the genome to varying degrees

  • cancer genomes may have other alterations that could affect the observed gene expression patterns, including copy-number alterations, dysregulation of transcription factors, chromatin regulators or cis-regulatory elements

Last updated