# IR事件保守的长度

## 保守的IR事件

| 类型         | 事件数目 | 基因数  |
| ---------- | ---- | ---- |
| At 与 A2保守  | 6474 | 2387 |
| Dt 与 D5 保守 | 7733 | 2814 |
| At与Dt保守    | 6418 | 2494 |
| A2与D5保守    | 6229 | 2418 |

## 保守IR在长度上也相等的数目

```bash
## A2与At
awk -F "_" '$5==$(NF-1){print $0}' A2_At_conserve_IR.txt|wc -l
## Dt与D5
awk -F "_" '$7==$(NF-1){print $1"_"$2}' D5_Dt_conserve_IR.txt|wc -l
## At与Dt
awk -F "_" '$7==$(NF-1){print $1"_"$2}' At_Dt_conserve_IR.txt|wc -l
## A2与D5
awk -F "_" '$5==$(NF-1){print $1}' D5_A2_conserve_IR.txt|wc -l
```

|      类型      | 事件数目 | 长度不相等 | 总事件数 |
| :----------: | :--: | :---: | :--: |
|  At 与 A2长度相等 | 3047 |  3427 | 6474 |
| Dt 与 D5 长度相等 | 3342 |  4391 | 7733 |
|   At与Dt长度相等  | 1644 |  4774 | 6418 |
|   A2与D5长度相等  | 1841 |  4388 | 6229 |

## IR长度不保守时，长度相差的范围

```bash
## At与A2长度不保守时相差范围
awk -F "_" '$5>$(NF-1){print $5-$(NF-1)}$5<$(NF-1){print -$5+$(NF-1)}' A2_At_conserve_IR.txt
## Dt与D5
awk -F "_" '$7>$(NF-1){print $7-$(NF-1)}$7<$(NF-1){print -$7+$(NF-1)}' D5_Dt_conserve_IR.txt
## At与·Dt
awk -F "_" '$7>$(NF-1){print $7-$(NF-1)}$7<$(NF-1){print -$7+$(NF-1)}' At_Dt_conserve_IR.txt
## A2与D5
awk -F "_" '$5>$(NF-1){print $5-$(NF-1)}$5<$(NF-1){print -$5+$(NF-1)}' D5_A2_conserve_IR.txt
```

### 做个饼图

* 1\~10bp
* 10\~50bp
* 50\~100bp
* 100bp以上

```bash
awk '$1<=10{print $0}' ${i}|wc -l
awk '$1<=50&&$1>10{print $0}'  ${i}|wc -l
awk '$1>50&&$1<=100{print $0}'  ${i}|wc -l
awk '$1>100{print $0}'  ${i}|wc -l
```

### 比较多倍化过程中长度的变化

* 多倍化之前的IR长度时一样的
* 多倍化之后其中一个基因组的IR长度发生了变化
* 多倍化之后，两个基因组的IR长度都同时增加或减少

```bash
# A2 D5
awk -F "_" '$5-$(NF-1)>100{print $0}$5-$(NF-1)<-100{print $0}' D5_A2_conserve_IR.txt
# At Dt
awk -F "_" '$7-$(NF-1)>100{print $0}$7-$(NF-1)<-100{print $0}' At_Dt_conserve_IR.txt
```
