DNA甲基化分析流程
1.对原始数据进行过滤
java -jar trimmomatic-0.32.jar PE -threads 18 -phred33 R1.fastq R2.fastq -baseout 输出文件目录/文件前缀 ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:10 TRAILING:10 SLIDINGWINDOW:4:20 MINLEN:50 >log.${ID}.trim 2>err.${ID}.trim2.使用Bismark进行甲基化的检测
2.1 准备基因组索引文件
#指定基因组文件所在文件夹
./bismark_genome_preparation --hisat2 travis_files/
#之后会生成两个转化后的基因组文件,及对应的索引
├── Bisulfite_Genome
│ ├── CT_conversion
│ │ ├── BS_CT.1.ht2
│ │ ├── BS_CT.2.ht2
│ │ ├── BS_CT.3.ht2
│ │ ├── BS_CT.4.ht2
│ │ ├── BS_CT.5.ht2
│ │ ├── BS_CT.6.ht2
│ │ ├── BS_CT.7.ht2
│ │ ├── BS_CT.8.ht2
│ │ └── genome_mfa.CT_conversion.fa
│ └── GA_conversion
│ ├── BS_GA.1.ht2
│ ├── BS_GA.2.ht2
│ ├── BS_GA.3.ht2
│ ├── BS_GA.4.ht2
│ ├── BS_GA.5.ht2
│ ├── BS_GA.6.ht2
│ ├── BS_GA.7.ht2
│ ├── BS_GA.8.ht2
│ └── genome_mfa.GA_conversion.fa2.2 进行比对
2.3 过滤比对得到的bam文件
2.4 提取对应的甲基化位点
2.5基于统计上的显著性提取对应的位点
CHH文件太大了分开跑
合并多个文件的内容
统计没有甲基化的位点与发生了甲基化的位点
在python中进行多重测验
参考
Last updated