计算同源基因间AS的保守程度

根据之前使用blast比对获得的同源基因间IR的保守情况,将每个基因的AS保守程度进行量化
- 完全不保守 - 两个同源基因间都有IR,但是都不保守 
- 其中有一个同源基因没有IR事件,使得不存在保守的IR 
 
- 部分保守 - 两个同源基因都存在AS事件,但是只有部分是保守的 
 
- 某一个基因全部保守 - A2中的IR与At中的IR完全保守,但At中还存在新的IR事件 
- At中的IR与A2中完全保守,但A2中仍旧有部分不保守 
 
- 两个基因的所有IR事件都是保守的 
计算公式
(A保守程度^2+B保守程度^2)/2
只有当其中一个基因完全保守时,才会大于0.5,都保守时等于1
- 0没有保守的AS 编码4
- >0||<=0.5存在交集 编码3
- >0.5||<1其中之一完全保守 编码2
- =1两个互相保守 编码1
保守程度的差异
分别比较两个亚基因组在多倍化之后,保守程度的差异情况,
- 可以看到,在多倍化的过程中与二倍体祖先基因组相比,两个亚基因组保守程度无显著性差异 
- 而在四倍体中At与Dt的保守程度增加,相比与原来二倍体状态下的A2、D5;说明两个基因组在聚合到同一个细胞核内后,共享一些剪切因子,使得它们的剪切方式趋向于保守。 

保守的IR长度与非保守的IR长度
- At与A2基因组比较中保守IR与非保守的IR长度差异 
- Dt与D5基因组比较中保守IR与非保守IR长度差异 
- A2与D5基因组比较中保守与非保守IR长度差异 
- At与Dt基因组比较中保守与非保守IR长度差异 
#非保守的IR
cut -f1 ../A2_At_conserve_IR.txt|awk '{print ">"$1}'|cat - ../../A2_intron_junction.fasta|grep ">"|sort |uniq -u|awk -F "_" '{print $(NF-1)}'
#保守的IR
cut -f1 ../A2_At_conserve_IR.txt|awk '{print ">"$1}'|cat - ../../A2_intron_junction.fasta|grep ">"|sort |uniq -d|awk -F "_" '{print $(NF-1)}'
Last updated
Was this helpful?