重新下载原始数据进行比对
hisat2比对
##构建索引
bsub -J TM1 -n 10 -o %J.hisat2.out -e %J.hisat2.err -R span[hosts=1] "hisat2 -x ~/work/Alternative/data/Ghirsutum_genome_HAU_v1.0/hisat2_build/TM1.0 -1 ../Trimmomatic/SRR5886147_Trimm_1P -2 ../Trimmomatic/SRR5886147_Trimm_2P -p 10 --novel-splicesite-outfile TM1_splicesite.txt --max-intronlen 10000 --rf -S TM1_leaf.sam"
## 过滤和去重PCR重复
bsub -J samtools -n 2 -o %J.samtools.out -e %J.samtools.err -R span[hosts=1] "samtools view -q 20 -S TM1_leaf.sam -@ 2 -b -o TM1_leaf.bam && samtools sort -@ 2 TM1_leaf.bam -O bam -o TM1_sorted.bam &&samtools rmdup TM1_sorted.bam TM1_rmdup.bam"Stringtie计算gene表达量
stringtie hisat2/TM1_rmdup.bam -G ~/work/Alternative/result/homologo/FEST3/isforms/TM1/geneExpress/isform.gtf -b ./stringtie/ -p 10计算PIR、PSI
计算所有Intron的PSI
AS剪切在一定程度上造成了isform的多样性
比较由AS产生的保守isform发生NMD的比例、和由AS产生的uniq isform发生NMD的比例
先把所有转录本的ORF预测了
关于对参考基因组中注释的isform的验证,需要筛选一下
cDNA序列序列5’和3‘已经确定了,感觉不需要反转
对鉴定到的PacBio isform进行NMD分析

分析AS与NMD

Last updated