分析染色体上各种特征

his比对文件

统计每个染色体区间中比对到的read数目,首先将histal2比对得到的sam文件,排序然后过滤质量获得每个read在基因组的比对位置

## 将sam文件转bam文件 然后排序

## 构建index索引
samtools index  file.bam
## 统计每条染色体上比对到的read数目和没比对到的
samtools idxstats  file.bam
#Chr04    98600468    4081232    7711
#Chr05    97880472    8856721    16729
#Chr06    132263754    5038917    10081
#Chr07    97507971    6642915    12732
#Chr08    129432109    5741117    13716
#Chr09    85040211    8261237    13135
#Chr10    129486693    7377850    12289
## 使用view模块统计的不是read数目,比对上的位置数目,当一个read比对到多个位置时,则算多次
samtools view -c file.bam
## 根据第5列比对质量进行过滤
samtools view -q 25 file.bam -b -o filter.bam

​ 将bam文件转换成bed文件

## 转bed文件 cigar添加BAM文件第6列信息
~/software/bedtools2-2.29.0/bin/bamToBed  -i filter.bam -cigar
### 结果 第5列是比对质量
Chr01   85706   85856   SRR5886155.6807251/1    60      -       150M1S
Chr01   85706   85856   SRR5886155.6808629/1    60      -       150M1S
Chr01   86495   86645   SRR5886155.23364097/1   60      +       150M
Chr01   86628   86774   SRR5886155.23364097/2   60      -       146M5S
Chr01   86783   86858   SRR5886155.47331331/2   60      +       14M1I61M
Chr01   86783   86856   SRR5886155.47335377/2   60      +       14M1I59M
Chr01   86789   86928   SRR5886155.37835722/2   60      +       8M1I131M
Chr01   86790   86941   SRR5886155.57945650/2   60      +       151M

参考

Last updated