🎨
booknote
  • Zpliu'Booknote
  • ggplot2
    • 不继承原有数据
    • Untitled Folder 1
      • 直方图绘制
    • 02基于Github笔记实现
    • 回归分析
    • 饼图
    • Theme函数
    • 直方图
    • 分面
    • pheatmap
    • 折线图
    • 桑基图
    • GO富集分析图
    • jupyter内使用R
    • 维恩图
    • 自定义图例
    • ggridges 山峦图
    • GO气泡图
    • 散点图
    • 从数据框中计算频率
    • 箱型图
  • 前端操作
    • 实例练习
      • 动态搜索网页
        • 后端
          • Node 服务框架
          • primer数据表的增删改查
          • 前端post请求
          • login 验证
          • Vue模板
            • Vue-router前端渲染
            • main.vue
          • 基于cookie登录验证
          • 使用mysql包进行数据库的交互
          • 数据库表
            • 学生信息表
            • 用户登录表
            • mysql 事务
            • 教师表
            • 引物表
          • mysql服务
          • html模板页面
            • 错误模板页
          • 08文件上传与下载
        • 解决webpack打包后文件过大问题
        • 前端
          • vue
            • 基于element-ui框架
            • 06 个人主页
            • 08上传组件el-upload
            • element-ui
            • Vue 构建前端框架
            • login登录界面
            • 07表格多选
            • show-data页面
          • vue-cookie
          • vue-router
            • 路由组件传参
        • Appach代理服务转发node
      • pie-progress
        • 01
      • 登录界面
      • Untitled
    • JavaScript
      • fasta文件校验
      • codewar中的练习题
      • 6kyu
      • chapter03
        • 数据类型
      • tweenjs
    • css
      • CSS布局
      • 02定位
    • 前端使用ajax进行异步请求
    • gitbook
    • html
      • 03表格
      • Vue星空
    • Log for study
  • 可变剪切
    • 第六次分析
      • 设计引物
      • 多倍化过程中的变化3
      • 不同棉种间AS的差异
      • At与Dt中不存在保守转录本的基因
      • AS调控基因表达
      • 多倍化过程中变化2
      • 可变剪切统计
      • 可变剪切的进化分析
      • 保守AS模式的鉴定
      • 提纲
      • 可变剪切的翻译分析
      • 多倍化过程中isoform的变化
      • 表观遗传在AS中的作用
      • 全长转录本数据的统计
      • 表观遗传在AS中的作用2
    • 03表观遗传与可变剪切
    • 数据处理流程
      • 计算同源基因间AS的保守程度
      • 重新开始鉴定AS.md
      • 统计IR保守性比例
      • 基因分类
      • 20200111可变剪切数目统计
      • 完全保守的基因对
      • 20200315
      • 20200214
      • 第三个结果
      • 20191230对AS类型进行定义
      • AS保守程度的统计
      • 20200219合并IR
      • 20200320
      • IR事件保守的长度
      • 分析同源基因中发生IR事件的频率
      • 保守的IR的长度统计
      • 筛选基因用于GO富集分析
      • 2020102把没有发生剪切事件的位置找出来
      • 对剪切事件进行分类
      • 06比较不同棉种中isform的差异
      • 甲基化数据处理
      • 寻找motif
      • 根据IR的保守程度对基因进行GO富集分析
      • 分析同源基因间可变剪切的差异
      • 基于前面已经分好的类进行统计
      • 寻找同源基因对应的位点
      • 对同源基因的剪切事件进行分类.md
      • 分析染色体上各种特征
      • HIN1下游调控基因的分析
      • intron 分布
      • 20200102GO富集分析
      • 01全长转录组数据处理
      • 甲基化重复间的处理
    • 文献理解
      • 10核小体定位决定外显子识别
      • 22
      • 09梨树中两个亚基因组经历unbiased 进化
      • 11RNA介导的局部染色质修饰对可变剪切的调控
      • 19讨论染色质开放程度与IR的关系
      • 03植物中的表观遗传
      • 06甲基化在拟南芥开花过程中的研究
      • 20可变剪切的进化
      • 14干旱积累对HIN1蛋白剪切效率的影响
      • 18内含子保留事件中不断变化的范式和调控方式
      • 04从RNA-seq研究可变剪切
      • 16多种RNA-seq策略揭示棉花中高精度的转录态势
      • 07ChIp-seq测序原理 chromatin immunoprecipitation
      • 05甲基化测序数据比对原理
      • 13使用iso-seq分析高粱转录本数据
      • 15POWERDRESS与HDA9相互作用促进去乙酰化
      • 12通过转录与染色质结构的耦合调控可变剪切
      • 英语句子
      • paper list
      • 01多组学数据揭示表观遗传
      • 02A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulat
      • 17可变剪切与表观遗传导致白血病
      • 21smallRNA与DNA甲基化
    • 文章提纲
    • AS多倍化过程中的变化
    • 软件使用
      • 01三代测序Iso-seq
      • Bedtools
      • iso-seq测序2.0版本
      • 02Chip-seq操作流程
      • EMBOSS
      • 05鉴定duplicate gene
      • 07kobas本地进行注释
      • MEME本地化
      • DNA甲基化分析流程
      • stringtie
    • 第7个结果
    • 原始数据处理
      • 01三代测序数据原理
      • 02测序read数目统计
    • 第8个结果
    • 第五次分析
      • isoform水平分析
      • rmats2sashimiplot
      • 可变剪切的鉴定
      • 使用单个样本的数据进行AS分析
    • 表观遗传
    • 保守AS的鉴定
    • 第四次分析了
      • 甲基化计算
      • AS统计
      • 分析IR在各个基因组的保守性
    • 第三次对AS进行统计
      • 鉴定DRMs区域
      • 04
      • 重新下载原始数据进行比对
      • 02
      • 01
    • 第三个结果
    • 原始read的分类
    • 表观数据分析
    • 从RNA-seq研究可变剪切
  • 文献
    • 表观遗传
      • 植物中甲基化机制以及靶向操纵工具
    • 陈增建老师
      • 文章
    • 可变剪切
      • Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants
      • Variant phasing and haplotypic expression from long-read sequencing in maize
      • 02
      • 01
      • 可变剪接的研究进展及展望
      • 06
      • Co-expression networks reveal the tissue-specific regulation of transcription and splicing
    • panGenome
      • 番茄中广泛的结构变异对基因表达和性状改良中的作用
    • TWAS
      • TWAS解读
    • 数量遗传older
      • Reinventing quantitative genetics for plant breeding: something old, something new, something borrow
    • Untitled 1
    • 多倍化
      • Measuring and interpreting transposable element expression
      • Homoeolog expression bias and expression level dominance (ELD) in four tissues of natural allotetrap
    • 转录调控
      • 指导植物RNA聚合酶II转录的‘GPS’
      • 02综述
    • 3D基因组
      • Methods for mapping 3D chromosome architecture
      • 由粘连蛋白介导的人类基因组中染色体loop图谱
      • 经典Hi-C文献
      • 小麦染色质被组装成基因组疆域和转录工厂
      • Lamina-associated domains: peripheral matters and internal affairs
      • Three-dimensional chromatin landscapes in T cell acute lymphoblastic leukemia
      • Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer
      • Evolutionary dynamics of 3D genome architecture following polyploidization in cotton
      • On the existence and functionality of topologically associating domains
    • Untitled
    • GWAS
      • Population Genomic Analysis and De Novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary
  • CRISP Case9
    • sgRNA设计
    • 01编辑效率检测
    • Hi-TOM
    • 02检查单株覆盖度
  • python
    • matplotlib
      • 图片的基本设置
      • 韦恩图
      • 折线图
      • 堆积直方图
      • 散点图
      • imshow绘制热图
    • 爬虫
      • 根据关键字获取对应的基因
      • TE
    • 多进程
    • 基于模块化编程
    • pybedtools
      • 01API
    • 高级特性
      • 列表操作
      • pickle
    • SOS
      • Script of scripts (SOS)
    • python 解析命令行参数
    • 简单实现python多进程
    • gffutils
      • gffutils
    • 多线程读取文件
    • rpy2
      • 在jupyter中调用R代码
    • pandas
      • 取数据
    • pysam
      • 01API接口
  • cottonWeb
    • 初始化项目
    • views
      • login
      • 404页面
      • register页面
    • 后端
      • Hi-C
      • 错误代码合集
      • SequenceServer搭建网页服务
      • 手把手教你搭建JBrowse-初始化应用
      • 优化JBrowse
    • Vue中使用Echarts
    • 2配置axios请求
    • 07搜索框实时推荐
    • 动画效果
    • layout布局
    • mysql
      • 基因操作
    • 路由配置
  • Vue
    • vue-route
      • 路由
    • Vue中发起ajax请求
    • 计算属性和侦听器
    • provide inject
    • 列表渲染
    • 自定义指令
    • 事件处理
    • Vue项目
      • 九宫格实现
      • 使用vue-resource进行ajax请求
      • 在项目中使用v-router
      • 新闻页面
      • 项目迁移
      • 使用Mint UI组件库
    • 案例操作
      • 02基于Github笔记实现
      • 实现购物车功能
      • Vue组建化
      • todomvc实现日程安排
    • 页面组件化
    • Vue 实例化操作
    • vue
    • 动画的渲染
    • 模板语法
    • class & style
    • 13 动画和过渡效果
    • 02guide
    • 深入了解组件化
    • 表单输入绑定
    • 条件渲染v-if
    • vue-chartjs
      • 起步
  • 并行计算
    • 实验室考试
    • 计算圆周率PI
    • 04.forthClass
    • 使用python3中的threading模块进行简单的并行计算
    • test
      • lastTest
      • 111
    • 第三节课作业
    • 05 test
    • 04test
    • 05homework
    • 04homework
    • OpenMP
    • 集群结构
    • CPU核、多线程、多进程
    • 05Class
    • 06class
    • 07class
    • 08class
  • WebPack
    • 打包css文件
    • 基于Webpack进行Vue开发
    • 处理url 图片
    • webpack 打包Vue
    • 基于webpack的路由操作
    • webpack
  • VueCLI
    • 03组件批量注册
    • 04拖拽插件
    • 05axios跨域问题
    • 07时间轴
    • Blast+ 网页实现
    • VueCLI 安装
    • axios请求
  • Script
    • 转录因子结合位点预测
    • BinomTest
  • mysql
    • 常见函数
      • 常见函数
      • 函数
    • 查询
      • 排序查询
      • 联合查询
      • 基本查询语句
    • 字段约束条件
    • SQLyog
    • 修改
      • 修改
    • powerdesigner数据库模型设计
    • 插入
      • 插入数据
    • 事务
      • 事务
    • 添加新用户
    • 视图
      • 视图
  • 文本编辑器
    • vscode 连接数据库
    • Vue模板补齐
    • visual Studio Code
  • source_code
    • Untitled
    • 并行计算
      • 04test
    • 公众号
      • RNA-seq
    • Untitled 1
  • GWAS
    • QQ-plot
  • RNA-seq
    • 01AnalysisFlow
    • 02脚本批量提交
    • 差异表达基因
    • 文献
      • 01SPL1赋予植物热忍受能力
    • 02 建库方式
  • Linux
    • LSF
    • 02诺和致源下载数据
    • 配置阿里yum源
    • linux三剑客
    • 云梯
    • 取文件相同列
    • root基本命令
    • 服务器网站数据搬迁
    • shell脚本激活Conda环境
    • 使用vscode与服务端R交互
    • 如何使用Conda
    • vim常见使用方法
    • oh-my-zsh
    • bash中的字典与数组
  • SNP分子标记
    • vcf文件处理
  • 生信软件
    • samtools
    • bedtools
    • annovar注释SNP
    • HiC-Pro安装
    • Untitled
    • bwa使用
  • Hi-C
    • 软件
      • HiCPlotter安装
      • pre程序
    • 20200102计算共线性区间保守的boundary
    • 20200108保守的TAD
    • PanGenome
      • PanGenome与各个元件进行注释
      • Pan-Genome数据比对
      • 鉴定两个基因组之间重排
  • node
    • mysql
      • 使用Promise封装
      • 基本的SQL语句
      • mysql的增删改查
      • 在node中使用mysql
    • session与cookie保留用户登录状态
    • MongoDB
      • MongoDB中的SQL语句
      • MongoDB 数据库
      • mongoose中一些常用的查询语句
      • :pig_nose: node中使用MongoDB的实例
      • MongoDB关联查询
      • 设计数据模型
    • 保持数据库处于连接状态
    • npm
    • node中路由设计
    • express中中间件的概念
    • art-template模块的用法
    • curd增删改查的使用
    • Promise 异步编程
    • 关于express框架的学习
    • express-session
    • 配置log4js
  • Cell-Ranger
    • count输出文件夹
      • ANALYSIS
      • feature_bc_matrix文件夹
      • Analysis 结果
      • BARcoded BAM
    • CellRanger aggr
    • 10X genomics测序中用到的术语
    • single sample Analysis
    • Cell Ranger count使用手册
  • HOX3
    • 03共表达分析
    • 01RNA-seq
    • 02基因差异表达分析
  • vue-admin
    • 项目目录结构
  • R
    • dplyr
      • dpylr
      • 过滤数据框
  • 系统遗传学
    • 翻译综述
    • 从脊椎动物的视角解析衰老的遗传机制
    • 01
  • eQTL
    • PEER
      • PEER方法
      • 软件使用
    • 群体结构
      • bcftools
  • sQTL
    • HISAT2比对
    • 02数据处理
  • 资源
    • hexo服务搭建
    • 转录因子数据库
    • 前端资源
    • 01 优雅的PPT设计
    • 文章书写规范
  • SVG
    • 01起步
  • 王悦瑾
    • Bash练习题
    • Bash脚本
    • 9_28起步
  • ES6
    • 模板字符串
    • promise源码解析
    • 01
  • scRNAseq
    • 干细胞不对称分裂
      • Root stem cell niche organizer specification by molecular convergence of PLETHORA and SCARECROW tran
    • 茉莉酸代谢
    • 老年痴呆
  • 多倍体进化
    • 棉花进化
    • 棉属A基因组的起源与进化
  • Vuex
    • 解构前端登录请求
    • VueX
  • ElementUI
    • 源码学习
      • 01drawer
    • Element UI:rocket:
  • reference周记
    • 第一期
    • test
  • 苏柃
    • Bash练习
Powered by GitBook
On this page
  • 分析同源基因对间转录本的保守性
  • 分析存在保守AS事件的同源基因
  • RI和SE在多倍化过程中的变化
  • 分析RI和SE在四个亚基因组中的保守性
  • 第五个结果:多倍化过程中转录本的保守性

Was this helpful?

  1. 可变剪切
  2. 第六次分析

多倍化过程中的变化3

分析同源基因对间转录本的保守性

统一用21066对四元同源基因对

在21066对同源基因中,转录出转录本的基因和没有转录本的基因数

  • A2 14602基因存在PacBio转录本

  • D5 13122基因存在PacBio转录本

  • AT 11543基因存在PacBio转录本

  • Dt 11749基因存在PacBio转录本

两个基因组间同时存在转录本的基因数

  • A2 vs D5 11885

  • A2 vs At 10670

  • D5 vs Dt 10198

  • At vs Dt 9063

四个同源基因都存在PacBio转录本:

8087个四组同源基因同时存在PacBio转录本

  • A2_vs_At

  • A2_vs_D5

  • At_vs_Dt

  • D5_vs_Dt

##比较亚组间转录本的保守性
bash Gh_result/05polyploidization/01isoformConserved/conserve_isoform.sh
##筛选保守的转录本
awk '$3~/A2/&&$4~/At/&&$6>=0.95{print $0}' Isoform_CDS.txt >A2_vs_At_conservedIsoform.txt

比较

存在保守转录本

不存在

A2 vs At

6112(57.3%)

4558(42.7%)

D5 vs Dt

6079(59.6%)

4119(40.4%)

A2 vs D5

7365(61.9%)

4520(38.1%)

At vs Dt

3249(35.8%)

5814(64.2%)

首先我们对同源基因都存在PacBio转录本进行了筛选,一共筛选得到了10670对A2 vs At和10198对D5 vs Dt同源基因对,

分析了各个同源基因内AS基因数目和AS事件:

  • A2和At同源基因分别有

    • A2 5430个基因存在16791个AS事件

    • At 4912个基因存在13628个AS事件

  • D5和Dt同源基因分别有

    • D5 5843个基因存在17136个AS事件

    • Dt 4745个基因存在13238个AS事件

比较了这些同源基因对转录本的保守情况,一共鉴定到

6112(57.3%)和6079(59.6%)存在保守转录本的同源基因对;同时我们发现30.4%-32.7%的同源基因对不存在功能保守的转录本。

##都表达的同源基因中存在AS的数目
A2_At_expression_A2_AS.txt
A2_At_expression_At_AS.txt
##

21066对同源基因中表达的基因数和AS事件数目

基因组

AS事件

基因数

A2

18814

6417

D5

18991

6805

At

13981

5122

Dt

14083

5115

多倍化过程中保守的AS比例:

(2885+3418)/(18814+18991)

分析同源基因间保守的AS事件:

使用K-mer获得定位另外一个基因组上的坐标,然后将k-mer坐标与AS坐标取交集,获取保守的剪接事件。

  • k-mer坐标至少需要90%与AS坐标存在交集

  • 所有的AS事件都保守

  • 存在特异性的AS事件

分析保守的剪接事件之间序列的相似程度是否比较高

特异性的剪接事件对应的PSI值差不多。

##D5 vs Dt
 cat splitFile/*kmer.txt >AS_kmer.txt
 ##获取k-mer对应的剪接事件
 python ~/github/zpliuCode/Isoseq3/04ASconserved/extractConservedAS.py  AS_kmer.txt  ../../../05polyploidization/02ASevent/Dt_homolog_AS.txt 11
 awk '$2!~/>/{print $0}' 11  >D5_Dt_conservedAS.txt

获取特异性的剪接事件对应是constitutive Exon或者Intron

 ##获取特异性IR和SE事件对应k-mer为constitutive-exon或者intron
 awk '$2~/>/{print $0}' 11|grep RI >D5_specialRI.txt
 awk '$2~/>/{print $0}' 11|grep SE >D5_specialSE.txt
 ##提constitutive exon
 intersectBed -loj -a gene.bed AS_length/constitutive_exon.bed -F 1|awk '{OFS="\t";print $7,$8+1,$9-1,$4,$6,"constitutiveExon"}' >TM1/constitutiveExon.bed
 ##提取constitutive intron
  intersectBed -loj -a gene.bed AS_length/constitutive_intron.bed -F 1|awk '{OFS="\t";print $7,$8,$9,$4,$6,"constitutiveExon"}' >TM1/constitutiveExon.bed
  ##分类
  python ~/github/zpliuCode/Isoseq3/04ASconserved/extractSpecialAS.py D5_specialRI.txt ../../constitutiveFeature/TM1/constitutive_feature.bed  3
  ##计算每种事件的PSI值
  python ~/github/zpliuCode/Isoseq3/03ASquantify/extractASPSI.py all_AS_quantify.txt ASeventFile.txt outFile.txt

分析存在保守AS事件的同源基因

同源基因间存在保守的AS数和基因数,

A基因组间存在保守AS的基因比例比D基因组小,A亚组进化快一些

AS的保守程度:(那种一对多的情况,如果大于1就当做1来算)

都存在AS的同源基因对,比较这些同源基因的AS保守情况

(保守的AS数a+b)/(同源基因的AS数 a+b)

  • A基因组和D基因组在多倍化前后

  • A基因组AS更保守还是D基因组

D基因组AS相比于A基因组更保守,多倍化后At、Dt间AS剪接更加保守

RI和SE在多倍化过程中的变化

A2 vs At

保守的RI事件:

保守的SE事件:

A基因组中特异性AS事件的去向

type

RI

SE

exon

intron

Other

Special Total

A2RI

1481

-

530 (7.6%)

3984 (57.2%)

2457(35.3%)

6971

A2SE

-

182

295(33.8%)

325(37.3%)

251(28.9%)

871

AtRI

1481

-

439(9.6%)

2379(52.0%)

1758(38.4%)

4576

AtSE

-

182

399(42.0%)

207(21.8%)

345(36.2%)

951

D基因组中特异性AS的去向

type

RI

SE

exon

intron

Other

special Total

D5RI

1410

-

576(9.7%)

3070(51.4%)

2322(38.9%)

5968

D5SE

-

287

873(55.6%)

319(20.3%)

378(24.1)

1570

DtRI

1410

-

523(11.0%)

2380(50.2%)

1839(38.8%)

4742

DtSE

-

287

284(35.9%)

258(32.6%)

249(31.5%)

791

多倍化过程中大量亚组特异性的AS事件,转变为了组成型的intron和组成型的exon;

比较多倍化前后保守AS的PSI和PSJ变化

由于测序read覆盖不足的原因,鉴定出的很多AS可能是短暂出现,可能是剪接机制一不小心错误的识别了冒名顶替的剪接位点。为了准确的鉴定多倍化过程中AS的变化,我们对物种中包含多转录本的基因的AS event进行了量化:

过滤掉那种只由参考转录本和PacBio比较得出的AS,这种AS无法进行量化,对于与参考转录本比较得到的AS时,参考转录本的reads数默认为0

$a/(a+b+c)$

a: 包含剪接事件的转录本对应的FL read数目

b、c: 不包含剪接事件的转录本对应的FL read 数目

junction reads that support inclusion of alternative

junction reads that support exclusion of alternative exons

对于RI事件,支持的read数目还要进行标准化

read count read length 2/(read length *2+event length)

  • PSI 包含这个剪接事件的比例

    对于AS变成constitutive exon或者constitutive intron;这个也许由于测序深度的影响造成AS没有检测到,分析PSI值差异大不大。

  • constitutive exon PSI为1

  • constitutive intron PSI为0

    PSI再乘以基因的表达量,之后用于DNA甲基化数据的时候

##对筛选的AS事件,进行量化03quantifyASevent
python ~/github/zpliuCode/Isoseq3/03ASquantify/caculateAS_ratio.py  ../02ASevent/A2_homolog_AS.txt  ~/work/Alternative/result/Gh_result/CO31_32_result/evolution4/A2_PacBio.txt  11
##使用RNA-seq的数据进行量化
python ~/github/zpliuCode/Isoseq3/03ASquantify/PSIByRNAseq.py  1  ~/work/Alternative/result/homologo/FEST3/geneExpress/hisat2/D5_rmdup.bam 22

由多倍化过程中内含子转变为IR的PSI值明显的低于外显子转变为IR,存在剪接印记效应,这种剪接转录本的含量比较低,或者是发挥完作用后被降解的过程中被测到了。

为了找到多倍化过程中稳定且保守的RI事件。我们使用另外一个RNA-seq的短读read数据对RI事件的含量进行了量化。同样发现了类型的现象,根据short-read得到稳定的RI事件。

  • IR2intron

  • IR2exon

  • intron2IR

  • exon2IR

  • SE2intron

  • SE2exon

  • exon2SE

  • intron2SE

  • IR2IR

  • SE2SE

IR转变为intron的例子中,IR的PIR值很低,这会不会是事件只是短暂的出现了一会

虽然这个地方检测到了RI的存在,但主要还是以非RI的转录本为主。

但是也存在打破这种诅咒的现象;用RNA-seq做一个例子的图

  • intron变成IR后,IR的PSI值很高,read数目也很多

分析RI和SE在四个亚基因组中的保守性

保守的RI和SE事件

  • A2 D5 1418 180

  • At Dt 1107 179

  • A2 At 1491 182

  • D5 Dt 1412 287

 ##AS在四个基因组中的保守性
 python ~/github/zpliuCode/Isoseq3/04ASconserved/homologConservedAS.py  all_conserve_RI_SE.txt  11
 ##筛选同一个位置处得到最保守的剪接事件,
  python ~/github/zpliuCode/Isoseq3/04ASconserved/filterConservedAS.py  ../A2_D5/A2_D5_conserved_AS.txt 11
 ##二倍体和四倍体中保守的AS事件
 awk '$1~/RI/||$1~/SE/{print $0}' ../A2_D5/A2_D5_conserved_AS.txt |wc -l
 ##A基因组和D基因组保守的AS事件
  • 在二倍体和四倍体都保守的IR和SE事件

都保守的AS事件:577

只在二倍体中存在,2274

只在四倍体中存在 1981

  • 在A基因组和D基因组保守的IR和SE事件

只在A基因组中存在,2308

只在D基因组中存在 :2841

亚组特异性的剪接事件?

举例子:

总结:

  • 分析存在保守AS的基因占(存在AS基因)的比例(柱状图)

  • 分析多倍化过程中IR向intron和exon类型转变(很多特异AS事件转变为CI)

  • 不同转变类型的PIR值大小(箱型图),特例图(打破诅咒的)

  • 比较不同基因组间AS的保守程度(箱型图)

  • 二倍体和四倍体都存在的保守IR和SE(韦恩图,胶图)

    举个例子(PacBio转录本例子)

    筛选标准:

    • read数目都大于10

    • PSI值都大于0.1

    • 保守的RI事件之间,PSI值相差两倍以上

    • 不保守的RI事件,则是PSI值介于0.05-0.95,支持read>5

      #根据PSI值筛选差异的RI事件,进行GO富集分析
      paste A2RI_PSI.txt AtRI_PSI.txt |awk '$7-$3>$3||$3-$7>$7{print $0}'|less 
      ##特异性的RI事件
      awk '$3>=0.05&&$3<=0.95&&$2>5{print $0}' A2RI_PSI.txt |less

    在这些保守的IR或者SE事件中,有多少PSI值是存在两倍差异的

基因组

二倍体上调

四倍体上调

不变

A RI

1481

96()

553()

832()

D RI

1410

106()

345()

959()

A SE

25()

21()

136()

D SE

287

35()

21()

231()

对差异表达的保守RI事件进行GO富集分析

第五个结果:多倍化过程中转录本的保守性

模型:AS加速同源基因间的进化

比较转录本的趋同进化和并行分化

2418个同源基因在多倍化前后都存在功能保守的转录本。

多倍化前有多少比例的同源基因存在保守转录本:

  • 二倍体中 7365/11885 (62.0%) 基因存在保守转录本

  • 四倍体中 有3249/9063 (35.8%)基因存在保守转录本

  • A2 vs At中有6112/10670 (57.3%)基因存在保守的转录本

  • D5vsDt中有6079/10198 (59.6%) 基因存在保守的转录本

比较不同基因组间转录本的保守程度

  • 多倍化前后,不同基因组存在保守转录本的基因的比例变化(柱状图)

  • 分析四个同源基因间存在保守转录本的基因数(韦恩图)

  • 分析存在保守转录本的同源基因,相比于功能发生分化的同源基因表达水平和Ka/Ks值(箱型图)

多倍化过程中存在保守转录本基因与非保守基因表达水平和Ka\Ks值

并行分化

虽然At、Dt间保守转录本的程度比较低,只有(3249)30%多。5814个亚基因组同源基因功能发生了分化,在这些功能分化的同源基因中有80.3%的基因是与二倍体祖先存在功能一致的转录本的。

  • 2346 个At基因与A2存在保守的转录本 (饼状图)

  • 240个At基因与D5存在保守的转录本

  • 2322个Dt基因与D5存在保守的转录本

  • 231个Dt基因与A2存在保守的转录本

在At与Dt转录本分化的这些同源基因中,有基因是分别转录了二倍体基因的不同转录本,基因的AS直接变成不同基因来转录不同的转录本,形成功能互补。总的来说一共有4402基因与二倍体相比存在保守的转录本,而亚基因组同源基因间不存在保守的转录本。

这些同源基因转录本发生分化的基因中,基因表达水平和Ka/Ks值的差异(柱状图)

比较分化的At、Dt基因与保守的转录本的At、Dt基因,在AS数目上的差异程度。

##保守的亚基因组同源基因,AS数目上的差异程度
awk 'NR%2!=0{printf $0"\t"}NR%2==0{print $0}'  conserved_AScount.txt |awk '{print sqrt(($2-$4)*($2-$4))}' >1
##不保守的亚基因组同源基因,AS数目上的差异程度
awk 'NR%2!=0{printf $0"\t"}NR%2==0{print $0}' diversity_AScount.txt |awk '{print sqrt(($2-$4)*($2-$4))}' >2

## 计算相差AS数目对应的频率
sort 1 -n|uniq -c |awk '{print $1/3249"\t"$2}'

GO富集图(分析)

举例子(igv画转录本结构图)

在发生分化的At、Dt同源基因中,有多少对同源基因是祖先同源基因功能分化的结果,两个同源基因分别转录出祖先不同的转录本,承担不同的功能,亦或者是通过AS来调节同源基因的表达。

  • 在2346 个At与A2存在保守转录本的基因中,有296个Dt基因与A2相比也存在保守的转录本,

  • 在2322个Dt与D5存在保守转录本的基因中,有221个At基因与D5相比存在保守的转录本。

有的At、Dt同源基因既可能继承了A2的互补转录本,也可能继承了D5的互补转录本;所以去个重,总共得到了464个同源基因对,它们分别转录出祖先基因中的一个转录本,功能上是互补。

  • 同源基因产生功能互补的转录本,这些转录本存在AS的差异

##At、Dt亚组间转录本功能发生分化的基因,但是都与祖先基因组存在保守的转录本 :/public/home/zpliu/work/Alternative/result/Gh_result/05polyploidization/01isoformConserved/homologDifferentiation
cut -f3 At_Dt_differ_D5_Dt_gene.txt |xargs -I {} grep {} ../D5_vs_At/conserved_Isoform.txt |cut -f1 |sort |uniq |xargs  -I {} grep {} ~/work/Alternative/result/Gh_result/CO31_32_result/evolution5/A2_D5_At_Dt_collinearity.txt  >At_DtDifferent_AllConservedWithDiploid/At_Dt_different_AllConservedWithD5.txt
##对应的转录本,在A2中是否存在AS差异
python ~/github/zpliuCode/Isoseq3/08IsoformDifferentiation/homologIsoformDifferentiation.py ~/work/Alternative/result/Gh_result/CO31_32_result/evolution2/D5_AS.txt  ../../D5_vs_Dt/D5_vs_Dt_conservedIsoform.txt ../../D5_vs_At/conserved_Isoform.txt 22 At_Dt_different_AllConservedWithD5.txt

转录本的保守程度(箱型图)

A基因组的转录组经历更大变化

不同基因组间转录本的保守程度:

保守转录本数目/(转录出转录本的数目) 保守程度:

  • A2 At 0.386

  • D5 Dt 0.421

  • A2 D5 0.413

  • At Dt 0.248

A、D亚基因组;转录本功能上更加分化,但是AS剪接更加保守。

AS的保守与转录本的功能保守性之间是否存在联系(柱状图)

多少比例的分化是由于AS导致的

讨论:这种保守的AS信号可能是由于同处于一个细胞核的剪接复合体的识别造成,三维结构上的靠近。

  • 存在保守AS的基因,转录本的保守性,与不存在保守AS的基因,转录本功能的保守性;AS的保守性和转录本功能的保守性存在关联

  • 转录本功能分化程度和基因AS剪接保守程度是否存在弱相关性(柱状图)

Previous设计引物Next不同棉种间AS的差异

Last updated 4 years ago

Was this helpful?