05甲基化测序数据比对原理
Last updated
Last updated
CG 对称型甲基化
CHG 对称性甲基化
CHH 非对称性甲基化
这里的对称与否,主要是看DNA双链中,对应位置的两个C碱基是否呈现中心对称的;如果是对称的话两条链的C甲基化信息也是完全一样的
基因组序列在亚硫氰酸盐处理后,甲基化的C碱基仍旧保持为C碱基,而没有甲基化的C碱基则变成了U碱基
利用这个原理,首先将组织中的DNA序列提取出来,使用Bisuffite处理打断后,进行PCR扩增,构建测序文库
其中正链DNA序列 Top strand序列经过PCR扩增后会产生两种DNA片段
OT 与扩增序列信息是一致的,只不过发生 u ->T的替换
CTOT 与扩增序列是互补的 ,互补为 A-U C-G T-A
负链DNA序列Bottom strand同样存在两种PCR产物
OB
CTOB
这也就是Bismark软件中对着集中序列的说明信息了
对基因组测序得到了这些序列的信息后,没有甲基化的C碱基,在测序后得到的碱基可能是A或者T,但大部分都是T;
例如
OT和OB序列 则是T
CTOT和CTOB则是A
所以在接下来的比对过程中,根据你PCR产物构建的不同类型的文库,选择不同的参数进行分析
分别将基因组序列的正链和负链中的C,转化为T,再和测序read进行比较,如果有T-C的部位,那这里对应基因组的位置就是发生了甲基化的地方
对于CTOB与CTOT序列,在和基因组进行比较时其他位置完全匹配,只有发生甲基化的位置,会有T-G的匹配