20191230对AS类型进行定义

前面通过Blast的方法对可变剪切在不同亚基因组间的保守性进行了分类,然后对每一类基因定义了一个概念,这个概念是紧紧围绕多倍化过程中,可变剪切在二倍中同源基因和四倍体同源基因的变化情况

第一类比较保守的AS

conservation AS pattern

conservation AS pattern

筛选条件

  • 匹配长度大于200bp

  • 相似度大于90%

  • 覆盖度超过85%

代码

做成bed文件

第二类多倍化后四倍体中AS发生丢失

AS loose

  • symmetry loose

  • At asymmetry loose

  • Dt asymmetry loose

AS loose

代码

做成bed文件

第三类多倍化后四倍体AS重新获得

AS gain

  • symmetry gain

  • At asymmetry gain

  • Dt asymmetry gain

AS gain

代码

:warning:单个基因组存在的事件得再converseBed目录下运行

做成bed文件

第四类四倍体中两个亚基因组有趋同效应

convergence effect

  • convergence to gain

  • convergence to loose

convergence effect

代码

做成bed文件

第五类

AS事件在不同亚基因组间保守

做成bed文件

求只在单个基因组中的剪切事件

在只某一个基因组中保守的类型,先统计与其他基因组中保守的类型的bed1文件,然后剔除掉这些就是只在某个基因组中单独存在的剪切事件了。

A2与At 、D5与Dt间保守的剪切事件

统计基因数与事件数

总共有16类,对每一类都统计一下对应的事件的数目

intronR

事件

基因数目

事件数目

1_1

840

1489

1_2

8071

1_3

1122

1869

1_4

1438

2247

2_1

651

977

2_2

600

861

2_3

1043

1541

At

3858

7683

3_2

1038

1571

Dt

3924

8053

4_1

579

876

4_2

825

1245

A2

4087

8451

D5

5066

10217

ExonS

事件

基因数目

事件数目

1_1

38

42

1_2

15390

1_3

103

108

1_4

235

254

2_1

34

35

2_2

38

39

2_3

83

87

At

712

800

3_2

66

68

Dt

661

740

4_1

22

23

4_2

86

88

A2

656

759

D5

1406

1648

AltA

事件

基因数目

事件数目

1_1

137

167

1_2

12517

1_3

212

262

1_4

423

477

2_1

90

110

2_2

62

69

2_3

172

198

At

1805

2312

3_2

367

421

Dt

1777

2359

4_1

81

91

4_2

218

261

A2

1555

2126

D5

2127

2809

AltD

事件

基因数目

事件数目

1_1

82

95

1_2

13275

1_3

169

216

1_4

284

331

2_1

66

85

2_2

44

50

2_3

125

146

At

1671

2122

3_2

316

364

Dt

1714

2243

4_1

56

62

4_2

148

181

A2

1291

1688

D5

1550

1934

对同源基因间的剪切取交集

Dt中的可变剪切

At中的可变剪切

D5中的可变剪切

A2中的可变剪切

Last updated

Was this helpful?