> For the complete documentation index, see [llms.txt](https://zpliu.gitbook.io/booknote/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://zpliu.gitbook.io/booknote/ke-bian-jian-qie/di-wu-ge-jie-guo.md).

# AS多倍化过程中的变化

## AS在亚基因组间的偏好性

* bias conserve AS

  A2与D5中存现保守AS事件，并且该保守的事件，只在At或者Dt中才存在
* pair conserve AS

  At与Dt中存在保守的剪切事件，并且该保守的剪切事件只要存在一个祖先基因组与它保守

```bash
## bias conserve AS
python ~/scripte/Alternative/module/BiasASconseve.py  -CA1 A2_At_conserve_end -CA2 D5_Dt_conserve_end  -PCA1 A2_D5_conserve_end  -PCA2 At_Dt_conserve_end  -o Bais_conserve_IR.out

## pair conserve AS
python ~/scripte/Alternative/module/PairAS.py -CA1 A2_At_conserve_end  -CA2 D5_Dt_conserve_end  -PCA1 At_Dt_conserve_end  -o Pair_conserve_IR.out
```

| 事件   | bias conserve 事件数目 | pair conserve |
| ---- | ------------------ | ------------- |
| IR   | 1968               | 3720          |
| ES   | 95                 | 209           |
| AltA | 196                | 530           |
| AltD | 126                | 354           |

## 看表达量的变化

提取bias的基因对应的表达量

```bash
awk '$3~/Ghir_A/{print $3}' Bais_conserve_IR.out |cut -f1 -d "-"|head
```

提取Pair 基因对应的表达量

```bash
awk '{print $1,$2}' Pair_conserve_IR.out|head

## 根据文件名，提取bed信息
awk -F "-" '$5=="+"{print $2,$3,$4,$5,$0}$5==""{print $2,$3,$4,"-",$0}' OFS="\t"  >Bais_conserve.bed
296873    307084
```

## 四倍体中At、Dt可变剪切的差异

At、Dt中，保守程度，与表达量的变化，目录`At_Dt`

```bash
 python ~/scripte/Alternative/module/At_Dt_conservePrecentage.py -homolog ~/work/Alternative/result/homologo/homologGene/At_vs_Dt_collinerity.txt  -isform ./IR_count  -AS  ./../blastdb/IR/At_Dt_conserve_end -o 
#基因 事件数，保守的事件数，保守率
#Ghir_A01G000190    0    Ghir_D01G000200    3    0    0
#Ghir_D01G000200    3    Ghir_A01G000190    0    0    0
#Ghir_A01G000420    0    Ghir_D01G000420    1    0    0

awk 'NR%2==0{print $3,$4,$1,$2,$5,$6}NR%2!=0{print $0}' OFS="\t"  1|uniq >conserve_precentage_IR.txt
```

* 同源基因都存在剪切事件，完全保守
* 同源基因都存在剪切事件，部分保守
* 同源基因都存在剪切事件，不保守
* 只有一个同源基因存在剪切事件，不保守

提取对应的表达量数据

```bash
python ~/scripte/Alternative/module/At_Dt_FPKM.py  -homolog ~/work/Alternative/result/homologo/homologGene/At_vs_Dt_collinerity.txt  -FPKM ~/work/RNA-seq/hisat2_out/leaf/leaf_BAM/Gh/gene_fpkm.txt  -AS ./conserve_precentage_IR.txt  -o 1
## 最后得到8列数据
A基因编号 事件数目 B基因编号 事件数目 保守事件数 保守率 A基因表达量 B基因表达量
```

比较同源基因间AS保守程度与基因表达水平的差异

> 表达差异使用log2去算

```bash
awk -v fild1=7 -v fild2=8 -f ~/github/zpliuCode/script/log2.awk  1 |head

##得到差异表达基因
cat 1|awk -v fild1=7 -v fild2=8 -f ~/github/zpliuCode/script/log2.awk  |awk 'sqrt($9*$9)>=1{print $0}'

## 统计不同范围保守度的差异表达基因数
cat IR_FPKM|awk -v fild1=7 -v fild2=8 -f ~/github/zpliuCode/script/log2.awk  |awk 'sqrt($9*$9)>=1{print $0}'|awk '$6>=0&&$6<0.2{print $0"\t"0.1}$6>=0.2&&$6<0.4{print $0"\t"0.3}$6>=0.4&&$6<0.6{print $0"\t"0.5}$6>=0.6&&$6<0.8{print $0"\t"0.7}$6>=0.8&&$6<=1{print $0"\t"0.9}'
## 看事件是否存在nonsen-mediate decay
```

* 在差异表达的基因中，有多少是偏向于At、多少偏向于Dt的，做GO富集分析
* 基因的差异表达与AS的保守程度
* AS存在差异，与nosense-mediate decay扯上关系

| AS保守度   | 差异表达基因数目 | 比例    |
| ------- | -------- | ----- |
| 0-0.2   | 2086     | 0.697 |
| 0.2-0.4 | 184      | 0.061 |
| 0.4-0.6 | 266      | 0.089 |
| 0.6-0.8 | 320      | 0.107 |
| 0.8-1   | 138      | 0.046 |

```bash
#画图，AS保守率与基因表达之间的关系
AS_FPKM.R 画图脚本
```

### 进行GO富集分析

* At中上调的基因 1196对
* Dt中上调的基因 1798对

```bash
## 分析GO结果画气泡图
awk -F "\t" 'NR>1&&$9<=0.05{print $1,$2,$3,$4/$6,$4,$6,$9}' OFS="\t"  DtUp.txt >DtUp.plot

##手动筛选

## GO气泡图
```
