可变剪切统计
统计AS与计算PSI值
conda activate suppa
##提取感兴趣的AS的坐标
suppa.py generateEvents -i PacBio.gtf -o TM1 -e SE SS RI FL MX -f ioe分析两种转录本在不同剪切事件的比例
分析发生AS的转录本与没发生AS的转录本表达量的差异
Last updated
conda activate suppa
##提取感兴趣的AS的坐标
suppa.py generateEvents -i PacBio.gtf -o TM1 -e SE SS RI FL MX -f ioeLast updated
for i in `ls .|grep -E D52_.*ioe`; do awk '$4~/PB/{print $4}' ${i} |sed 's/\,/\n/g'|sort |uniq |grep PB|wc -l; done##提取对应事件的PacBio编号,并且打上Annotion标签
for i in RI SE AL AF A3 A5 MX; do awk '$4~/PB/{print $4}' TM2_${i}_strict.ioe |sed 's/,/\n/g'|grep PB|awk '{print "'${i}'""\t"$0}'|sort |uniq >${i}_isoform.txt; python ~/work/Alternative/result/Gh_result/CO31_32_result/ORF/AddAnnotionTag.py ../collapse/PacBio_Annotion/all_isoform.txt ${i}_isoform.txt 11; mv 11 ${i}_isoform.txt; done
##统计数目
for i in `ls .|grep isoform`; do awk '$(NF)=="unAnnotion"{a+=1}$(NF)=="Annotion"{b+=1}END{print a"\t"b}' ${i}; done##给转录本打上AS的标签
cat *isoform.txt |awk '{print $0"\tAS\t"$2}'|sort -k5,5|uniq -f4 >Alternative_isoform.txt
##分析表达水平的差异
python ../ORF/AddAnnotionTag.py Alternative_isoform.txt ../collapse/PacBio_Annotion/all_isoform_FPKM all_isoform_FPKM
##统计AS的转录本的平均表达水平
awk '$(NF)=="AS"{print $(NF-2)}' ../AS2/all_isoform_FPKM |awk '{a+=$0}END{print a/NR}'