20200102计算共线性区间保守的boundary

给TAD赋编号

## A2
awk '$1<10{print "Chr"0$1,$2,$3,"A2_TAD_Chr"0$1"_"$2"_"$3"_"NR}$1>=10{print "Chr"$1,$2,$3,"A2_TAD_Chr"$1"_"$2"_"$3"_"NR}' OFS="\t" ../A2-HindIII-AllChrs_TAD.level0-level1-uniq_300K-3M.txt >A2_TAD.txt
## D5 
awk '$1<10{print "Chr"0$1,$2,$3,"D5_TAD_Chr"0$1"_"$2"_"$3"_"NR}$1>=10{print "Chr"$1,$2,$3,"D5_TAD_Chr"$1"_"$2"_"$3"_"NR}' OFS="\t" ../D5-Rep1-HindIII-AllChrs_TAD.level0-level1-uniq_300K-3M.txt >D5_TAD.txt 
## K

######################
Chr01    0    2300000    A2_TAD_Chr01_1
Chr01    2300000    3950000    A2_TAD_Chr01_2
Chr01    3950000    4600000    A2_TAD_Chr01_3
Chr01    4600000    5900000    A2_TAD_Chr01_4
Chr01    5900000    6350000    A2_TAD_Chr01_5

取交集

以A2的TAD出发,获得对应的D5的共线性区域

将共线性文件做成 A2开始的bed坐标文件

  • 共线性文件存在倒位现象,把它翻转过来

得到的结果

将D5基因坐标与D5的TAD取交集

输出结果

Test 2

获取D5和A2两个基因组的boundary坐标,从第3列左右各延伸150kb

将共线性区块做成bed文件

将A2的共线性区域与A2的boundary文件取交集

Test3

将K基因组的TAD染色体名字对应起来

D5的chr02与A2的chr01

使用基因的共线性block进行矫正

基因共线性区域文件

挑出异常区域

批量提交任务

间隔距离

conserve

None

percentage

150Kb D5 vs A2

1029

172

85%

D5 vs K12

834

367

69%

100Kb D5 vs A2

939

262

78%

D5 vs K12

681

520

56%

75Kb D5 vs A2

880

321

73%

D5 vs K12

547

654

45%

50KB D5 vs A2

750

451

62%

D5 vs K12

381

820

31%

有重组的染色体之间保守的TAD的数目

类型

保守

不保守

D5Chr01 vs A2Chr02

28

0

D5Chr02 vs A2Chr01

25

A2Chr01 vs K12Chr02

21

A2Chr02 vs K12Chr01

21

Test4

将染色体编号相同的文件合并

提取上下游150KB进行Blast

Blast建库方式可以单独每条染色体进行建库

单个染色体进行建库

使用染色体坐标去筛选匹配度最高的区域

查看对应TAD附近的共线性区域

Last updated

Was this helpful?