02Chip-seq操作流程
Chip-seq操作流程
1. 数据过滤Trimmomatic
可以参考我RNA-seq篇章中关于Trimmomatic的使用
2. Bowtie2进行比对
软件安装
直接下载编译好的版本就可以使用了
建立索引
开始比对
去除由于PCR重复产生的reads
3. 使用MACS进行比对
3.1 软件安装
https://github.com/taoliu/MACS/blob/master/INSTALL.md
3.2 软件使用
-t 接处理文件
-c 控制文件
-f 输入文件格式
-g 根据比对时canker基于组的大小而定
-n 输出文件名前缀
-B -q FDR值
3.3 解读输出文件
NAME_peaks.xls
文件每个峰的起始位置,和其他统计信息NAME_peaks.narrowPeak
BED6+4格式,可以在USCS基因组浏览器中打开它前几列的信息比较好理解,这是后几列的具体信息
5th: integer score for display. It's calculated as
int(-10*log10pvalue)
orint(-10*log10qvalue)
depending on whether-p
(pvalue) or-q
(qvalue) is used as score cutoff. Please note that currently this value might be out of the [0-1000] range defined in UCSC ENCODE narrowPeak format. You can let the value saturated at 1000 (i.e. p/q-value = 10^-100) by using the following 1-liner awk:awk -v OFS="\t" '{$5=$5>1000?1000:$5} {print}' NAME_peaks.narrowPeak
7th: fold-change at peak summit
8th: -log10pvalue at peak summit
9th: -log10qvalue at peak summit
10th: relative summit position to peak start
NAME_summits.bed
相当于NAME_peaks.narrowPeak
文件的精简版NAME_peaks.broadPeak
在--broad
模式下才会生成NAME_peaks.gappedPeak
在--broad
模式下才会生成NAME_model.r
画图的R脚本$ Rscript NAME_model.r
TheNAME_treat_pileup.bdg
对应处理样品的数据NAME_control_lambda.bdg
对应对照样品的数据bdgcmp
命令能够对着两个文件进行比较
4. call peaks统计每个区域的峰值
参考
Bedtools使用 https://www.jianshu.com/p/6c3b87301491
Last updated