2020102把没有发生剪切事件的位置找出来
只在At中不存在的IR事件
## At中不存在
cat converse/2_2 |xargs -I {} grep -A1 {} Dt_intron_junction.fasta >2_2.fasta
## blast比对
blastn -query 2_2.fasta -db ../blastDB/At -outfmt "6 qseqid sseqid qstart qend sstart send nident pident qcovs evalue bitscore" -evalue 1e-5 -out 2_2.query_blast.txt
## 比对之后有些基因不见了估计是不保守的原因吧
awk '$7>150&&$8>80&&$9>80{print $0}' 2_2.query_blast.txt
## 根据相似度和覆盖度在80%以上同时考虑正负链的情况
awk '$7>150&&$8>80&&$9>80{print $0}' 2_2.query_blast.txt|awk '{a[$1":"$2]+=1}END{for(i in a){if(a[i]>=2){split(i,b,":");print b[2];}}}'|xargs -I {} grep {} 2_2.query_blast.txt |awk '$7>150&&$8>80&&$9>80{print $0}'|awk '$3+100<300{if($6>a[$1":"$2][0]&&$6>$5){a[$1":"$2][0]=$6}else if($6<$5&&$5>a[$1":"$2][1]){a[$1":"$2][1]=$6}}$3+100>300{if($5>a[$1":"$2][1]&&$6>$5){a[$1":"$2][1]=$5}else if($6<$5&&$5>a[$1":"$2][0]){a[$1":"$2][0]=$5}}END{for(i in a){print i"\t"a[i][0]"\t"a[i][1]"\t"a[i][1]-a[i][0]+1}}'|awk '$4>0{print $0}' >2_no有了,没有发生IR事件的坐标之后可以看一下对应的甲基化程度怎么样
使用bin进行窗口的扫描
Last updated
