🎨
booknote
  • Zpliu'Booknote
  • ggplot2
    • 不继承原有数据
    • Untitled Folder 1
      • 直方图绘制
    • 02基于Github笔记实现
    • 回归分析
    • 饼图
    • Theme函数
    • 直方图
    • 分面
    • pheatmap
    • 折线图
    • 桑基图
    • GO富集分析图
    • jupyter内使用R
    • 维恩图
    • 自定义图例
    • ggridges 山峦图
    • GO气泡图
    • 散点图
    • 从数据框中计算频率
    • 箱型图
  • 前端操作
    • 实例练习
      • 动态搜索网页
        • 后端
          • Node 服务框架
          • primer数据表的增删改查
          • 前端post请求
          • login 验证
          • Vue模板
            • Vue-router前端渲染
            • main.vue
          • 基于cookie登录验证
          • 使用mysql包进行数据库的交互
          • 数据库表
            • 学生信息表
            • 用户登录表
            • mysql 事务
            • 教师表
            • 引物表
          • mysql服务
          • html模板页面
            • 错误模板页
          • 08文件上传与下载
        • 解决webpack打包后文件过大问题
        • 前端
          • vue
            • 基于element-ui框架
            • 06 个人主页
            • 08上传组件el-upload
            • element-ui
            • Vue 构建前端框架
            • login登录界面
            • 07表格多选
            • show-data页面
          • vue-cookie
          • vue-router
            • 路由组件传参
        • Appach代理服务转发node
      • pie-progress
        • 01
      • 登录界面
      • Untitled
    • JavaScript
      • fasta文件校验
      • codewar中的练习题
      • 6kyu
      • chapter03
        • 数据类型
      • tweenjs
    • css
      • CSS布局
      • 02定位
    • 前端使用ajax进行异步请求
    • gitbook
    • html
      • 03表格
      • Vue星空
    • Log for study
  • 可变剪切
    • 第六次分析
      • 设计引物
      • 多倍化过程中的变化3
      • 不同棉种间AS的差异
      • At与Dt中不存在保守转录本的基因
      • AS调控基因表达
      • 多倍化过程中变化2
      • 可变剪切统计
      • 可变剪切的进化分析
      • 保守AS模式的鉴定
      • 提纲
      • 可变剪切的翻译分析
      • 多倍化过程中isoform的变化
      • 表观遗传在AS中的作用
      • 全长转录本数据的统计
      • 表观遗传在AS中的作用2
    • 03表观遗传与可变剪切
    • 数据处理流程
      • 计算同源基因间AS的保守程度
      • 重新开始鉴定AS.md
      • 统计IR保守性比例
      • 基因分类
      • 20200111可变剪切数目统计
      • 完全保守的基因对
      • 20200315
      • 20200214
      • 第三个结果
      • 20191230对AS类型进行定义
      • AS保守程度的统计
      • 20200219合并IR
      • 20200320
      • IR事件保守的长度
      • 分析同源基因中发生IR事件的频率
      • 保守的IR的长度统计
      • 筛选基因用于GO富集分析
      • 2020102把没有发生剪切事件的位置找出来
      • 对剪切事件进行分类
      • 06比较不同棉种中isform的差异
      • 甲基化数据处理
      • 寻找motif
      • 根据IR的保守程度对基因进行GO富集分析
      • 分析同源基因间可变剪切的差异
      • 基于前面已经分好的类进行统计
      • 寻找同源基因对应的位点
      • 对同源基因的剪切事件进行分类.md
      • 分析染色体上各种特征
      • HIN1下游调控基因的分析
      • intron 分布
      • 20200102GO富集分析
      • 01全长转录组数据处理
      • 甲基化重复间的处理
    • 文献理解
      • 10核小体定位决定外显子识别
      • 22
      • 09梨树中两个亚基因组经历unbiased 进化
      • 11RNA介导的局部染色质修饰对可变剪切的调控
      • 19讨论染色质开放程度与IR的关系
      • 03植物中的表观遗传
      • 06甲基化在拟南芥开花过程中的研究
      • 20可变剪切的进化
      • 14干旱积累对HIN1蛋白剪切效率的影响
      • 18内含子保留事件中不断变化的范式和调控方式
      • 04从RNA-seq研究可变剪切
      • 16多种RNA-seq策略揭示棉花中高精度的转录态势
      • 07ChIp-seq测序原理 chromatin immunoprecipitation
      • 05甲基化测序数据比对原理
      • 13使用iso-seq分析高粱转录本数据
      • 15POWERDRESS与HDA9相互作用促进去乙酰化
      • 12通过转录与染色质结构的耦合调控可变剪切
      • 英语句子
      • paper list
      • 01多组学数据揭示表观遗传
      • 02A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulat
      • 17可变剪切与表观遗传导致白血病
      • 21smallRNA与DNA甲基化
    • 文章提纲
    • AS多倍化过程中的变化
    • 软件使用
      • 01三代测序Iso-seq
      • Bedtools
      • iso-seq测序2.0版本
      • 02Chip-seq操作流程
      • EMBOSS
      • 05鉴定duplicate gene
      • 07kobas本地进行注释
      • MEME本地化
      • DNA甲基化分析流程
      • stringtie
    • 第7个结果
    • 原始数据处理
      • 01三代测序数据原理
      • 02测序read数目统计
    • 第8个结果
    • 第五次分析
      • isoform水平分析
      • rmats2sashimiplot
      • 可变剪切的鉴定
      • 使用单个样本的数据进行AS分析
    • 表观遗传
    • 保守AS的鉴定
    • 第四次分析了
      • 甲基化计算
      • AS统计
      • 分析IR在各个基因组的保守性
    • 第三次对AS进行统计
      • 鉴定DRMs区域
      • 04
      • 重新下载原始数据进行比对
      • 02
      • 01
    • 第三个结果
    • 原始read的分类
    • 表观数据分析
    • 从RNA-seq研究可变剪切
  • 文献
    • 表观遗传
      • 植物中甲基化机制以及靶向操纵工具
    • 陈增建老师
      • 文章
    • 可变剪切
      • Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants
      • Variant phasing and haplotypic expression from long-read sequencing in maize
      • 02
      • 01
      • 可变剪接的研究进展及展望
      • 06
      • Co-expression networks reveal the tissue-specific regulation of transcription and splicing
    • panGenome
      • 番茄中广泛的结构变异对基因表达和性状改良中的作用
    • TWAS
      • TWAS解读
    • 数量遗传older
      • Reinventing quantitative genetics for plant breeding: something old, something new, something borrow
    • Untitled 1
    • 多倍化
      • Measuring and interpreting transposable element expression
      • Homoeolog expression bias and expression level dominance (ELD) in four tissues of natural allotetrap
    • 转录调控
      • 指导植物RNA聚合酶II转录的‘GPS’
      • 02综述
    • 3D基因组
      • Methods for mapping 3D chromosome architecture
      • 由粘连蛋白介导的人类基因组中染色体loop图谱
      • 经典Hi-C文献
      • 小麦染色质被组装成基因组疆域和转录工厂
      • Lamina-associated domains: peripheral matters and internal affairs
      • Three-dimensional chromatin landscapes in T cell acute lymphoblastic leukemia
      • Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer
      • Evolutionary dynamics of 3D genome architecture following polyploidization in cotton
      • On the existence and functionality of topologically associating domains
    • Untitled
    • GWAS
      • Population Genomic Analysis and De Novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary
  • CRISP Case9
    • sgRNA设计
    • 01编辑效率检测
    • Hi-TOM
    • 02检查单株覆盖度
  • python
    • matplotlib
      • 图片的基本设置
      • 韦恩图
      • 折线图
      • 堆积直方图
      • 散点图
      • imshow绘制热图
    • 爬虫
      • 根据关键字获取对应的基因
      • TE
    • 多进程
    • 基于模块化编程
    • pybedtools
      • 01API
    • 高级特性
      • 列表操作
      • pickle
    • SOS
      • Script of scripts (SOS)
    • python 解析命令行参数
    • 简单实现python多进程
    • gffutils
      • gffutils
    • 多线程读取文件
    • rpy2
      • 在jupyter中调用R代码
    • pandas
      • 取数据
    • pysam
      • 01API接口
  • cottonWeb
    • 初始化项目
    • views
      • login
      • 404页面
      • register页面
    • 后端
      • Hi-C
      • 错误代码合集
      • SequenceServer搭建网页服务
      • 手把手教你搭建JBrowse-初始化应用
      • 优化JBrowse
    • Vue中使用Echarts
    • 2配置axios请求
    • 07搜索框实时推荐
    • 动画效果
    • layout布局
    • mysql
      • 基因操作
    • 路由配置
  • Vue
    • vue-route
      • 路由
    • Vue中发起ajax请求
    • 计算属性和侦听器
    • provide inject
    • 列表渲染
    • 自定义指令
    • 事件处理
    • Vue项目
      • 九宫格实现
      • 使用vue-resource进行ajax请求
      • 在项目中使用v-router
      • 新闻页面
      • 项目迁移
      • 使用Mint UI组件库
    • 案例操作
      • 02基于Github笔记实现
      • 实现购物车功能
      • Vue组建化
      • todomvc实现日程安排
    • 页面组件化
    • Vue 实例化操作
    • vue
    • 动画的渲染
    • 模板语法
    • class & style
    • 13 动画和过渡效果
    • 02guide
    • 深入了解组件化
    • 表单输入绑定
    • 条件渲染v-if
    • vue-chartjs
      • 起步
  • 并行计算
    • 实验室考试
    • 计算圆周率PI
    • 04.forthClass
    • 使用python3中的threading模块进行简单的并行计算
    • test
      • lastTest
      • 111
    • 第三节课作业
    • 05 test
    • 04test
    • 05homework
    • 04homework
    • OpenMP
    • 集群结构
    • CPU核、多线程、多进程
    • 05Class
    • 06class
    • 07class
    • 08class
  • WebPack
    • 打包css文件
    • 基于Webpack进行Vue开发
    • 处理url 图片
    • webpack 打包Vue
    • 基于webpack的路由操作
    • webpack
  • VueCLI
    • 03组件批量注册
    • 04拖拽插件
    • 05axios跨域问题
    • 07时间轴
    • Blast+ 网页实现
    • VueCLI 安装
    • axios请求
  • Script
    • 转录因子结合位点预测
    • BinomTest
  • mysql
    • 常见函数
      • 常见函数
      • 函数
    • 查询
      • 排序查询
      • 联合查询
      • 基本查询语句
    • 字段约束条件
    • SQLyog
    • 修改
      • 修改
    • powerdesigner数据库模型设计
    • 插入
      • 插入数据
    • 事务
      • 事务
    • 添加新用户
    • 视图
      • 视图
  • 文本编辑器
    • vscode 连接数据库
    • Vue模板补齐
    • visual Studio Code
  • source_code
    • Untitled
    • 并行计算
      • 04test
    • 公众号
      • RNA-seq
    • Untitled 1
  • GWAS
    • QQ-plot
  • RNA-seq
    • 01AnalysisFlow
    • 02脚本批量提交
    • 差异表达基因
    • 文献
      • 01SPL1赋予植物热忍受能力
    • 02 建库方式
  • Linux
    • LSF
    • 02诺和致源下载数据
    • 配置阿里yum源
    • linux三剑客
    • 云梯
    • 取文件相同列
    • root基本命令
    • 服务器网站数据搬迁
    • shell脚本激活Conda环境
    • 使用vscode与服务端R交互
    • 如何使用Conda
    • vim常见使用方法
    • oh-my-zsh
    • bash中的字典与数组
  • SNP分子标记
    • vcf文件处理
  • 生信软件
    • samtools
    • bedtools
    • annovar注释SNP
    • HiC-Pro安装
    • Untitled
    • bwa使用
  • Hi-C
    • 软件
      • HiCPlotter安装
      • pre程序
    • 20200102计算共线性区间保守的boundary
    • 20200108保守的TAD
    • PanGenome
      • PanGenome与各个元件进行注释
      • Pan-Genome数据比对
      • 鉴定两个基因组之间重排
  • node
    • mysql
      • 使用Promise封装
      • 基本的SQL语句
      • mysql的增删改查
      • 在node中使用mysql
    • session与cookie保留用户登录状态
    • MongoDB
      • MongoDB中的SQL语句
      • MongoDB 数据库
      • mongoose中一些常用的查询语句
      • :pig_nose: node中使用MongoDB的实例
      • MongoDB关联查询
      • 设计数据模型
    • 保持数据库处于连接状态
    • npm
    • node中路由设计
    • express中中间件的概念
    • art-template模块的用法
    • curd增删改查的使用
    • Promise 异步编程
    • 关于express框架的学习
    • express-session
    • 配置log4js
  • Cell-Ranger
    • count输出文件夹
      • ANALYSIS
      • feature_bc_matrix文件夹
      • Analysis 结果
      • BARcoded BAM
    • CellRanger aggr
    • 10X genomics测序中用到的术语
    • single sample Analysis
    • Cell Ranger count使用手册
  • HOX3
    • 03共表达分析
    • 01RNA-seq
    • 02基因差异表达分析
  • vue-admin
    • 项目目录结构
  • R
    • dplyr
      • dpylr
      • 过滤数据框
  • 系统遗传学
    • 翻译综述
    • 从脊椎动物的视角解析衰老的遗传机制
    • 01
  • eQTL
    • PEER
      • PEER方法
      • 软件使用
    • 群体结构
      • bcftools
  • sQTL
    • HISAT2比对
    • 02数据处理
  • 资源
    • hexo服务搭建
    • 转录因子数据库
    • 前端资源
    • 01 优雅的PPT设计
    • 文章书写规范
  • SVG
    • 01起步
  • 王悦瑾
    • Bash练习题
    • Bash脚本
    • 9_28起步
  • ES6
    • 模板字符串
    • promise源码解析
    • 01
  • scRNAseq
    • 干细胞不对称分裂
      • Root stem cell niche organizer specification by molecular convergence of PLETHORA and SCARECROW tran
    • 茉莉酸代谢
    • 老年痴呆
  • 多倍体进化
    • 棉花进化
    • 棉属A基因组的起源与进化
  • Vuex
    • 解构前端登录请求
    • VueX
  • ElementUI
    • 源码学习
      • 01drawer
    • Element UI:rocket:
  • reference周记
    • 第一期
    • test
  • 苏柃
    • Bash练习
Powered by GitBook
On this page
  • 处理A2的原始数据
  • 看看公司跑的数据,最后就使用这个数据了
  • 提取FESTs序列
  • blast分析保守性
  • 比较不同的AS类型,保守程度是否存在差异
  • 不同剪切事件的长度差异
  • 对多倍化过程中的剪切事件进行分类
  • 看剪切事件在两个亚基因组间是否存在偏向性
  • 分析每个基因组中特异剪切事件对应的GO
  • 分析可变剪切对基因表达式水平的影响
  • 剪切事件在多倍化过程中的变化
  • 参考

Was this helpful?

  1. 可变剪切

第7个结果

PreviousstringtieNext原始数据处理

Last updated 4 years ago

Was this helpful?

  • 各个剪切事件并不是显著性的差异

  • ES数据核实一下

  • 同源基因之间的poly A的差异

  • 组成型intron与剪切intron之间长度差异

  • 同源基因在各个棉种的比较中AS的差异

  • 同源基因间表达的差异与保守度

  • 各个基因组中TE的插入

处理A2的原始数据

参考

AS数据的处理,由于D5基因组相比A2基因组,注释的转录本更多,这里看一下只考虑PacBio测序得到的与参考基因组进行比较的结果

for i in A2 D5 TM-1; do for j in IntronR AltA AltD AltP ExonS Other; do printf ${j}"\t"; grep ${j} ../${i}/end_third|grep PB|wc -l; done; done

和对应的基因数目

for i in A2 D5 TM-1; do for j in IntronR AltA AltD AltP ExonS Other; do printf ${j}"\t"; grep ${j} ../${i}/end_third|grep PB|cut -f2|sort|uniq|wc -l; done; done

基因组

IR

AltA

AltD

AltP

ES

Other

A2

28078

5199

4135

1823

2276

1435

D5

22226

3257

2434

1131

1719

1039

TM-1

40354

7823

6854

4665

3071

2539

At

19869

3868

3341

2301

1531

1197

Dt

20436

3946

3505

2363

1540

1342

看看公司跑的数据,最后就使用这个数据了

鉴定可变剪切的原理:

  1. 将PacBio测得的isoform比对到参考基因组,获得isform 注释信息

  2. 将PacBio isoform信息与参考基因组组中原有的注释信息进行合并

  3. 使用脚本,根据合并后的注释信息中的基因结构信息,提取对应剪切事件和发生的位置

由于A2基因组中原有的注释信息里没有不同转录本的注释信息,并且PacBio测序只测了leaf这一个组织,所以在与A2中原有的注释信息合并后,也不能完全的代表所有的转录本的注释信息

而D5和TM-1基因组中有不同转录本的注释信息,因此在根据基因结构去鉴定AS的时候,有有一些差异。

为了减少这个带来的差异,我在各个棉种中选择那种只被PacBio isoform支持的AS

没有统计scaffold上的AS事件

  • AS事件数目

基因组

IR

AltA

AltD

AltP

ES

Other

A2

36574

5847

4472

4394

2352

4269

D5

30379

5350

3845

4185

2229

6302

TM-1

51453

9749

8252

7358

3723

7915

At

25386

4878

4011

3621

1850

3882

Dt

26067

4871

4241

3737

1873

4033

  • gene 数目

基因组

IR

AltA

AltD

AltP

ES

Other

A2

9139

3147

2614

2200

1499

1881

D5

7466

2900

2295

2214

1443

2285

TM1

13574

5414

4740

3780

2399

3308

At

6657

2709

2345

1872

1210

1672

Dt

6917

2705

2395

1908

1189

1636

提取FESTs序列

python ~/scripte/Alternative/module/extractFEST2.py -p ~/work/Alternative/result/Gh_result/CO31_32_result/06_Alignment/all.collapsed.gtf  -r ~/work/Alternative/data/Ghirsutum_genome_HAU_v1.0/Ghirsutum_gene_model.gtf -AS ~/work/Alternative/result/Gh_result/CO31_32_result/11_AS/end_splice.txt  -g ~/work/Alternative/data/Ghirsutum_genome_HAU_v1.0/Ghirsutum_genome_HAU_v1.0.fasta  -IR 1 -ES 2 -AltA 3 -AltD 4
## D5在分析的时候,取的是CDS坐标

##拆分At与Dt

blast分析保守性

  • 相似度80% ,覆盖度80%以上 e-value 1e-5

统计每种AS对应的比例

# evm.TU.Ga01G0013        0       Ghir_A01G000130 0
出现这种情况是因为,这个基因不存在IR事件,但是存在AltA获取AltD等其他事件
## 统计同时存在AS的基因数,和AS数目
for i  in `ls .`; do  printf ${i}"\t"; awk '$2!=0&&$4!=0{a+=1;b+=$2+$3}END{print a"\t"b}' ${i}; done
## 统计保守的基因数,与AS数

保守IR事件

存在保守事件基因的比例:

再计算每个基因,AS事件的保守程度:

保守基因的比例:

  1. 2425/7142 33.95%

  2. 2274/6594 34.48%

  3. 31.91%

  4. 62.59%

保守事件的比例:

  1. 4789/36144 *2 26.50%

  2. 26.95%

  3. 24.14%

  4. 50.14%

比较

基因对数

事件数

保守基因对数

保守事件数没乘2

A2 vs At

7142

36144

2425

4789

D5 vs Dt

6594

32642

2274

4398

A2 vs D5

7218

35364

2303

4269

At vs Dt

2911

13551

1822

3397

保守ES事件

保守基因的比例:

  1. 31.10%

  2. 32.11%

  3. 23.28%

  4. 56.40%

保守事件的比例:

  1. 33.85%

  2. 36.47%

  3. 26.42%

  4. 65.40%

比较

基因对数

事件数

保守基因对数

保守事件数没乘2

A2 vs At

598

1152

186

195

D5 vs Dt

570

1146

183

209

A2 vs D5

524

984

122

130

At vs Dt

250

474

141

155

保守AltA事件

保守基因的比例:

  1. 55.22%

  2. 48.02%

  3. 41.05%

  4. 45.61%

保守事件的比例:

  1. 48.47%

  2. 48.25%

  3. 41.08%

  4. 45.98%

比较

基因对数

事件数

保守基因对数

保守事件数没乘2

A2 vs At

891

2030

433

492

D5 vs Dt

835

1919

401

463

A2 vs D5

765

1704

314

350

At vs Dt

820

1792

374

412

保守AltD事件

保守基因的比例:

  1. 49.92%

  2. 46.88%

  3. 40.26%

  4. 46.22%

保守事件的比例:

  1. 52.32%

  2. 51.19%

  3. 44.55%

  4. 49.36%

比较

基因对数

事件数

保守基因对数

保守事件数没乘2

A2 vs At

659

1380

329

361

D5 vs Dt

640

1344

300

344

A2 vs D5

544

1055

219

235

At vs Dt

662

1414

306

349

比较不同的AS类型,保守程度是否存在差异

  • 计算保守基因对,的AS事件保守程度

  • 不同剪切事件在多倍化的过程中,保守的程度不一样,其中ES最保守,而IR保守性最低

  • 同一类剪切事件,在不同基因组的比较中的保守程度差异

A2 vs At 叫保守,D5 vs Dt叫保守;

A2 vs D5叫并行分化,At vs Dt叫趋同进化

不同剪切事件的长度差异

  • 组成型的内含子

  • 保守的剪切事件对应的intronR

  • 不保守的剪切事件对应的intronR

#所有的型内含子
extract_splice_sites.py ~/work/Alternative/result/Gh_result/CO31_32_result/07_annotation/merge.gtf  >1111
awk '{print $1,$2+2,$3,$4}' OFS="\t"  1111 >all_intron.bed
 awk '{print $1,$2+2,$3,$4}' OFS="\t" ~/work/Alternative/data/Ghirsutum_genome_HAU_v1.0/Ghirsutum_gene_model_splce.txt >> all_intron.bed
sort -k1,1 -k2,3n all_intron.bed |uniq >1111
mv 1111 all_intron.bed

 ~/software/bedtools2-2.29.0/bin/intersectBed  -loj -a ../all_intron.bed  -b ./As_intronR.bed  >222
# 发生剪切的内含子
grep ">" ../../../TM1/1|sed 's/>//g'|awk -F "-" '{print $2"\t"$3"\t"$4"\tAlternative"}' |uniq  >As_intronR.bed

#组成型的intron
 awk '$5=="."{print $0}$5!="."&&($7-$6)/($3-$2)<0.4{print $0}' 222|cut -f1,2,3|sort |uniq |awk '{print $0"\tConstitutive"}'>constitutive_intron.bed
#存在剪切的内含子中保守的
cut -f3 ../../../blast/IR/A2_At_conserve_end|awk -F "-" '{print $2"\t"$3"\t"$4"\tconserve"}' >conserveAS.bed
#存在剪切的内含子中不保守的
 cat conserveAS.bed  As_intronR.bed |sort |uniq -u >noconserveAS.bed
  • 组成型的外显子

  • 发生ES的外显子

  • 保守的ES

##所有exon坐标
 cat ~/work/Alternative/result/Gh_result/CO31_32_result/07_annotation/merge.gtf ~/work/Alternative/data/Ghirsutum_genome_HAU_v1.0/Ghirsutum_gene_model.gtf |awk '$3~/exon/{print $1,$4,$5,$7}' OFS="\t" >all_exon.bed
 sort -k1,1 -k2,3 all_exon.bed |uniq >111
 mv 111 all_exon.bed
 ## 发生剪切的exon的坐标
 cat ../../../TM1/ES_length >./As.bed

 ##组成性exon
 cat all_exon.bed  As.bed |cut -f1,2,3|sort |uniq -u |awk '{print $0"\tconstitutive"}' >constitutive.bed

 ## 保守的ES的坐标
cut -f3 ../../../blast/ES/A2_At_conserve_end|xargs  -I {} grep {} As.bed |awk '{print $0"\tconserve"}' >conserve.bedd
 ## 不保守的ES坐标
cut -f1-4 conserve.bed|cat -  As.bed |sort |uniq -u |awk '{print $0"\tnocnoserve"}' >noconserve.bed

对多倍化过程中的剪切事件进行分类

  • parallel conserve

    • A2与D5中保守,在At与Dt中同样保守

    • A2与D5中不保守,但是在At与Dt中保守;A2 At或者D5 Dt中存在保守

  • bias conserve

    • A2与D5中保守,但是在At与Dt中不保守;A2 At或者D5 Dt中存在保守

    • A2与D5中不保守,在At与Dt中同样不保守;但是在A2 At或者D5 Dt中是保守的

## 目录 ParallelEvolution

四倍体内同源基因更多的发生分化

分析A2与D5中保守的剪切事件,在At、Dt中的保守情况 1. A2 D5中保守,在At与Dt中同样保守 2. A2 D5中保守,在At与Dt中不保守

A2和D5基因组分别是一个独立的个体,存在一些保守的AS,维持正常的生命活动;

剪切机制的存在往往是为了让植物能够快速响应外界环境的变化,在正常的环境中这种机制的存在往往是能量的浪费,因此在四倍体中,发现大多数原来在二倍体内保守的剪切事件,在四倍体内发生了分化,只在At中存在,或者只在Dt中存在,这两种比例各占一半

A2和D5作为一个独立的个体,因此具有一些保守的剪切事件;而剪切事件往往是一种能量的浪费;在四倍体内只需要某一个基因组存在对应的AS即可

类型

二倍体内保守

四倍体内保守

四倍体内不保守

IR基因

2303

536

1154

IR事件数

4269

838

1697

ES基因

122

21

46

ES事件

130

22

47

AltA基因

314

48

121

AltA事件

350

51

127

AltD基因

219

37

77

AltD事件

235

40

80

绘制图形

在画一个维恩图,A中保守的,D中保守的,At、Dt中同样保守的比例

##A基因组中保守的事件数
cat 1 2 3 4 |grep "Ghir_A"|grep "evm"|awk '{print $1"^"$2"^"$3"^"$4}'>Agenome_conserve.txt
cat 1 2 3 4 |grep "Ghir_D"|grep "Gor"|awk '{print $1"^"$2"^"$3"^"$4}' >Dgenome_conserve.txt

看剪切事件在两个亚基因组间是否存在偏向性

只在A基因组中保守的剪切事件,占A2和At中保守事件的比例

只在D基因组中保守的剪切事件

事件类型

只在A保守的占A中所有保守比例

只在Dt中保守的占D中所有保守的比例

IR

3623/4461

3189/4027

ES

164/176

154/186

AltA

394/445

358/409

AltD

287/327

270/310

分析每个基因组中特异剪切事件对应的GO

  • 在A基因组中特异的AS对应的基因富集的GO

  • 在D基因组中特异的AS对应的基因富集的GO

  • A、D中保守的AS对应的基因富集的GO

#在A基因组特异的
cut -f3 1|awk '{print "^^"$0"^"}'|cat - Agenome_conserve.txt | awk -F "^" '{print $3}'|sort|uniq -u|cut -f1 -d "-"|sort|uniq |xargs  -I {} grep {} ~/genome_data/Ghirsutum_genome_HAU_v1.1/Gh_Noscagenes_GO_V3_At.annot >A.GO
#在D基因组中特异的
cut -f4 1 |awk '{print "^^^"$0}'|cat - Dgenome_conserve.txt |awk -F "^" '{print $4}'|sort|uniq -u|cut -f1 -d "-"|sort|uniq |xargs  -I {} grep {} ~/genome_data/Ghirsutum_genome_HAU_v1.1/Gh_Noscagenes_GO_V3_Dt.annot >D.GO

分析可变剪切对基因表达式水平的影响

  • At与Dt中存在保守事件的基因

  • At与Dt中仅仅只有一个亚基因组中存在保守事件的基因

存在保守事件的同源基因对间的差异表达情况

不存在保守事件的同源基因对的差异表达情况

Divergence of duplicated genes by repeated partitioning of splice forms and subcellular localization

## 获取同源基因对
cat 1 2 |awk '{print $3"\n"$4}' |awk  -F "-" '{print $1}'|sort |uniq
cat 3 4 |awk '{print $3"\n"$4}' |sed '/*/d'|awk  -F "-" '{print $1}'|sort |uniq

## 获得同源基因对间的表达量
python homolog_expresion.py  -homolog ~/work/Alternative/result/homologo/homologGene/At_vs_Dt_collinerity.txt  -gene IR/At_Dt_bias_gene_ID  -FPKM ~/work/RNA-seq/hisat2_out/leaf/leaf_BAM/Gh/gene_fpkm.txt  -o IR/bias_fpkm

剪切事件在多倍化过程中的变化

  • 在二倍体中存在的事件,并且在四倍体中At、Dt保守;多倍化之前就存在的事件

  • 在二倍体中不存在的事件,但是在四倍体中保守;多倍化后新产生的事件

# 上个分类中1、2 文件

# 新产生的做个排除法

参考

不同AS事件,保守性不一样
四倍体内存在分化
事件数目统计
剪切事件是否存在偏向性

方差分析

卡方检验

https://www.omicsclass.com/article/344
https://zhuanlan.zhihu.com/p/57756620
https://zhuanlan.zhihu.com/p/42803826