05甲基化测序数据比对原理

1.甲基化的类型

  • CG 对称型甲基化

  • CHG 对称性甲基化

  • CHH 非对称性甲基化

这里的对称与否,主要是看DNA双链中,对应位置的两个C碱基是否呈现中心对称的;如果是对称的话两条链的C甲基化信息也是完全一样的

甲基化类型

2.Bisulfite测序原理

基因组序列在亚硫氰酸盐处理后,甲基化的C碱基仍旧保持为C碱基,而没有甲基化的C碱基则变成了U碱基

利用这个原理,首先将组织中的DNA序列提取出来,使用Bisuffite处理打断后,进行PCR扩增,构建测序文库

  1. 其中正链DNA序列 Top strand序列经过PCR扩增后会产生两种DNA片段

    • OT 与扩增序列信息是一致的,只不过发生 u ->T的替换

    • CTOT 与扩增序列是互补的 ,互补为 A-U C-G T-A

  2. 负链DNA序列Bottom strand同样存在两种PCR产物

    • OB

    • CTOB

这也就是Bismark软件中对着集中序列的说明信息了

OT      original top strand
CTOT    complementary to original top strand
OB      original bottom strand
CTOB    complementary to original bottom strand

3.序列比对

对基因组测序得到了这些序列的信息后,没有甲基化的C碱基,在测序后得到的碱基可能是A或者T,但大部分都是T;

例如

  • OT和OB序列 则是T

  • CTOT和CTOB则是A

所以在接下来的比对过程中,根据你PCR产物构建的不同类型的文库,选择不同的参数进行分析

分别将基因组序列的正链和负链中的C,转化为T,再和测序read进行比较,如果有T-C的部位,那这里对应基因组的位置就是发生了甲基化的地方

对于CTOB与CTOT序列,在和基因组进行比较时其他位置完全匹配,只有发生甲基化的位置,会有T-G的匹配

参考

https://blog.csdn.net/qq_29300341/article/details/53302961

https://github.com/FelixKrueger/Bismark/tree/master/Docs

Last updated