计算同源基因间AS的保守程度

根据之前使用blast比对获得的同源基因间IR的保守情况,将每个基因的AS保守程度进行量化

  • 完全不保守

    • 两个同源基因间都有IR,但是都不保守

    • 其中有一个同源基因没有IR事件,使得不存在保守的IR

  • 部分保守

    • 两个同源基因都存在AS事件,但是只有部分是保守的

  • 某一个基因全部保守

    • A2中的IR与At中的IR完全保守,但At中还存在新的IR事件

    • At中的IR与A2中完全保守,但A2中仍旧有部分不保守

  • 两个基因的所有IR事件都是保守的

计算公式

(A保守程度^2+B保守程度^2)/2

只有当其中一个基因完全保守时,才会大于0.5,都保守时等于1

  • 0没有保守的AS 编码4

  • >0||<=0.5存在交集 编码3

  • >0.5||<1其中之一完全保守 编码2

  • =1两个互相保守 编码1

保守程度的差异

分别比较两个亚基因组在多倍化之后,保守程度的差异情况,

  • 可以看到,在多倍化的过程中与二倍体祖先基因组相比,两个亚基因组保守程度无显著性差异

  • 而在四倍体中At与Dt的保守程度增加,相比与原来二倍体状态下的A2、D5;说明两个基因组在聚合到同一个细胞核内后,共享一些剪切因子,使得它们的剪切方式趋向于保守。

保守的IR长度与非保守的IR长度

  • At与A2基因组比较中保守IR与非保守的IR长度差异

  • Dt与D5基因组比较中保守IR与非保守IR长度差异

  • A2与D5基因组比较中保守与非保守IR长度差异

  • At与Dt基因组比较中保守与非保守IR长度差异

#非保守的IR
cut -f1 ../A2_At_conserve_IR.txt|awk '{print ">"$1}'|cat - ../../A2_intron_junction.fasta|grep ">"|sort |uniq -u|awk -F "_" '{print $(NF-1)}'
#保守的IR
cut -f1 ../A2_At_conserve_IR.txt|awk '{print ">"$1}'|cat - ../../A2_intron_junction.fasta|grep ">"|sort |uniq -d|awk -F "_" '{print $(NF-1)}'

Last updated