20191230对AS类型进行定义
前面通过Blast的方法对可变剪切在不同亚基因组间的保守性进行了分类,然后对每一类基因定义了一个概念,这个概念是紧紧围绕多倍化过程中,可变剪切在二倍中同源基因和四倍体同源基因的变化情况
第一类比较保守的AS
conservation AS pattern

筛选条件
匹配长度大于200bp
相似度大于90%
覆盖度超过85%
代码
做成bed文件
第二类多倍化后四倍体中AS发生丢失
AS loose
symmetry loose
At asymmetry loose
Dt asymmetry loose

代码
做成bed文件
第三类多倍化后四倍体AS重新获得
AS gain
symmetry gain
At asymmetry gain
Dt asymmetry gain

代码
:warning:单个基因组存在的事件得再converseBed目录下运行
做成bed文件
第四类四倍体中两个亚基因组有趋同效应
convergence effect
convergence to gain
convergence to loose

代码
做成bed文件
第五类
AS事件在不同亚基因组间保守
做成bed文件
求只在单个基因组中的剪切事件
在只某一个基因组中保守的类型,先统计与其他基因组中保守的类型的bed1文件,然后剔除掉这些就是只在某个基因组中单独存在的剪切事件了。
A2与At 、D5与Dt间保守的剪切事件
统计基因数与事件数
总共有16类,对每一类都统计一下对应的事件的数目
intronR
事件
基因数目
事件数目
1_1
840
1489
1_2
8071
1_3
1122
1869
1_4
1438
2247
2_1
651
977
2_2
600
861
2_3
1043
1541
At
3858
7683
3_2
1038
1571
Dt
3924
8053
4_1
579
876
4_2
825
1245
A2
4087
8451
D5
5066
10217
ExonS
事件
基因数目
事件数目
1_1
38
42
1_2
15390
1_3
103
108
1_4
235
254
2_1
34
35
2_2
38
39
2_3
83
87
At
712
800
3_2
66
68
Dt
661
740
4_1
22
23
4_2
86
88
A2
656
759
D5
1406
1648
AltA
事件
基因数目
事件数目
1_1
137
167
1_2
12517
1_3
212
262
1_4
423
477
2_1
90
110
2_2
62
69
2_3
172
198
At
1805
2312
3_2
367
421
Dt
1777
2359
4_1
81
91
4_2
218
261
A2
1555
2126
D5
2127
2809
AltD
事件
基因数目
事件数目
1_1
82
95
1_2
13275
1_3
169
216
1_4
284
331
2_1
66
85
2_2
44
50
2_3
125
146
At
1671
2122
3_2
316
364
Dt
1714
2243
4_1
56
62
4_2
148
181
A2
1291
1688
D5
1550
1934
对同源基因间的剪切取交集
Dt中的可变剪切
At中的可变剪切
D5中的可变剪切
A2中的可变剪切
Last updated
Was this helpful?