IR事件保守的长度

保守的IR事件

类型

事件数目

基因数

At 与 A2保守

6474

2387

Dt 与 D5 保守

7733

2814

At与Dt保守

6418

2494

A2与D5保守

6229

2418

保守IR在长度上也相等的数目

## A2与At
awk -F "_" '$5==$(NF-1){print $0}' A2_At_conserve_IR.txt|wc -l
## Dt与D5
awk -F "_" '$7==$(NF-1){print $1"_"$2}' D5_Dt_conserve_IR.txt|wc -l
## At与Dt
awk -F "_" '$7==$(NF-1){print $1"_"$2}' At_Dt_conserve_IR.txt|wc -l
## A2与D5
awk -F "_" '$5==$(NF-1){print $1}' D5_A2_conserve_IR.txt|wc -l

类型

事件数目

长度不相等

总事件数

At 与 A2长度相等

3047

3427

6474

Dt 与 D5 长度相等

3342

4391

7733

At与Dt长度相等

1644

4774

6418

A2与D5长度相等

1841

4388

6229

IR长度不保守时,长度相差的范围

## At与A2长度不保守时相差范围
awk -F "_" '$5>$(NF-1){print $5-$(NF-1)}$5<$(NF-1){print -$5+$(NF-1)}' A2_At_conserve_IR.txt
## Dt与D5
awk -F "_" '$7>$(NF-1){print $7-$(NF-1)}$7<$(NF-1){print -$7+$(NF-1)}' D5_Dt_conserve_IR.txt
## At与·Dt
awk -F "_" '$7>$(NF-1){print $7-$(NF-1)}$7<$(NF-1){print -$7+$(NF-1)}' At_Dt_conserve_IR.txt
## A2与D5
awk -F "_" '$5>$(NF-1){print $5-$(NF-1)}$5<$(NF-1){print -$5+$(NF-1)}' D5_A2_conserve_IR.txt

做个饼图

  • 1~10bp

  • 10~50bp

  • 50~100bp

  • 100bp以上

awk '$1<=10{print $0}' ${i}|wc -l
awk '$1<=50&&$1>10{print $0}'  ${i}|wc -l
awk '$1>50&&$1<=100{print $0}'  ${i}|wc -l
awk '$1>100{print $0}'  ${i}|wc -l

比较多倍化过程中长度的变化

  • 多倍化之前的IR长度时一样的

  • 多倍化之后其中一个基因组的IR长度发生了变化

  • 多倍化之后,两个基因组的IR长度都同时增加或减少

# A2 D5
awk -F "_" '$5-$(NF-1)>100{print $0}$5-$(NF-1)<-100{print $0}' D5_A2_conserve_IR.txt
# At Dt
awk -F "_" '$7-$(NF-1)>100{print $0}$7-$(NF-1)<-100{print $0}' At_Dt_conserve_IR.txt

Last updated