20200102计算共线性区间保守的boundary
给TAD赋编号
## A2
awk '$1<10{print "Chr"0$1,$2,$3,"A2_TAD_Chr"0$1"_"$2"_"$3"_"NR}$1>=10{print "Chr"$1,$2,$3,"A2_TAD_Chr"$1"_"$2"_"$3"_"NR}' OFS="\t" ../A2-HindIII-AllChrs_TAD.level0-level1-uniq_300K-3M.txt >A2_TAD.txt
## D5
awk '$1<10{print "Chr"0$1,$2,$3,"D5_TAD_Chr"0$1"_"$2"_"$3"_"NR}$1>=10{print "Chr"$1,$2,$3,"D5_TAD_Chr"$1"_"$2"_"$3"_"NR}' OFS="\t" ../D5-Rep1-HindIII-AllChrs_TAD.level0-level1-uniq_300K-3M.txt >D5_TAD.txt
## K
######################
Chr01 0 2300000 A2_TAD_Chr01_1
Chr01 2300000 3950000 A2_TAD_Chr01_2
Chr01 3950000 4600000 A2_TAD_Chr01_3
Chr01 4600000 5900000 A2_TAD_Chr01_4
Chr01 5900000 6350000 A2_TAD_Chr01_5取交集
以A2的TAD出发,获得对应的D5的共线性区域
将共线性文件做成 A2开始的bed坐标文件
共线性文件存在倒位现象,把它翻转过来
得到的结果
将D5基因坐标与D5的TAD取交集
输出结果
Test 2
获取D5和A2两个基因组的boundary坐标,从第3列左右各延伸150kb
将共线性区块做成bed文件
将A2的共线性区域与A2的boundary文件取交集
Test3
将K基因组的TAD染色体名字对应起来
D5的chr02与A2的chr01
使用基因的共线性block进行矫正
基因共线性区域文件
挑出异常区域
批量提交任务
间隔距离
conserve
None
percentage
150Kb D5 vs A2
1029
172
85%
D5 vs K12
834
367
69%
100Kb D5 vs A2
939
262
78%
D5 vs K12
681
520
56%
75Kb D5 vs A2
880
321
73%
D5 vs K12
547
654
45%
50KB D5 vs A2
750
451
62%
D5 vs K12
381
820
31%
有重组的染色体之间保守的TAD的数目
类型
保守
不保守
D5Chr01 vs A2Chr02
28
0
D5Chr02 vs A2Chr01
25
A2Chr01 vs K12Chr02
21
A2Chr02 vs K12Chr01
21
Test4
将染色体编号相同的文件合并
提取上下游150KB进行Blast
Blast建库方式可以单独每条染色体进行建库
单个染色体进行建库
使用染色体坐标去筛选匹配度最高的区域
查看对应TAD附近的共线性区域
Last updated
Was this helpful?