🎨
booknote
  • Zpliu'Booknote
  • ggplot2
    • 不继承原有数据
    • Untitled Folder 1
      • 直方图绘制
    • 02基于Github笔记实现
    • 回归分析
    • 饼图
    • Theme函数
    • 直方图
    • 分面
    • pheatmap
    • 折线图
    • 桑基图
    • GO富集分析图
    • jupyter内使用R
    • 维恩图
    • 自定义图例
    • ggridges 山峦图
    • GO气泡图
    • 散点图
    • 从数据框中计算频率
    • 箱型图
  • 前端操作
    • 实例练习
      • 动态搜索网页
        • 后端
          • Node 服务框架
          • primer数据表的增删改查
          • 前端post请求
          • login 验证
          • Vue模板
            • Vue-router前端渲染
            • main.vue
          • 基于cookie登录验证
          • 使用mysql包进行数据库的交互
          • 数据库表
            • 学生信息表
            • 用户登录表
            • mysql 事务
            • 教师表
            • 引物表
          • mysql服务
          • html模板页面
            • 错误模板页
          • 08文件上传与下载
        • 解决webpack打包后文件过大问题
        • 前端
          • vue
            • 基于element-ui框架
            • 06 个人主页
            • 08上传组件el-upload
            • element-ui
            • Vue 构建前端框架
            • login登录界面
            • 07表格多选
            • show-data页面
          • vue-cookie
          • vue-router
            • 路由组件传参
        • Appach代理服务转发node
      • pie-progress
        • 01
      • 登录界面
      • Untitled
    • JavaScript
      • fasta文件校验
      • codewar中的练习题
      • 6kyu
      • chapter03
        • 数据类型
      • tweenjs
    • css
      • CSS布局
      • 02定位
    • 前端使用ajax进行异步请求
    • gitbook
    • html
      • 03表格
      • Vue星空
    • Log for study
  • 可变剪切
    • 第六次分析
      • 设计引物
      • 多倍化过程中的变化3
      • 不同棉种间AS的差异
      • At与Dt中不存在保守转录本的基因
      • AS调控基因表达
      • 多倍化过程中变化2
      • 可变剪切统计
      • 可变剪切的进化分析
      • 保守AS模式的鉴定
      • 提纲
      • 可变剪切的翻译分析
      • 多倍化过程中isoform的变化
      • 表观遗传在AS中的作用
      • 全长转录本数据的统计
      • 表观遗传在AS中的作用2
    • 03表观遗传与可变剪切
    • 数据处理流程
      • 计算同源基因间AS的保守程度
      • 重新开始鉴定AS.md
      • 统计IR保守性比例
      • 基因分类
      • 20200111可变剪切数目统计
      • 完全保守的基因对
      • 20200315
      • 20200214
      • 第三个结果
      • 20191230对AS类型进行定义
      • AS保守程度的统计
      • 20200219合并IR
      • 20200320
      • IR事件保守的长度
      • 分析同源基因中发生IR事件的频率
      • 保守的IR的长度统计
      • 筛选基因用于GO富集分析
      • 2020102把没有发生剪切事件的位置找出来
      • 对剪切事件进行分类
      • 06比较不同棉种中isform的差异
      • 甲基化数据处理
      • 寻找motif
      • 根据IR的保守程度对基因进行GO富集分析
      • 分析同源基因间可变剪切的差异
      • 基于前面已经分好的类进行统计
      • 寻找同源基因对应的位点
      • 对同源基因的剪切事件进行分类.md
      • 分析染色体上各种特征
      • HIN1下游调控基因的分析
      • intron 分布
      • 20200102GO富集分析
      • 01全长转录组数据处理
      • 甲基化重复间的处理
    • 文献理解
      • 10核小体定位决定外显子识别
      • 22
      • 09梨树中两个亚基因组经历unbiased 进化
      • 11RNA介导的局部染色质修饰对可变剪切的调控
      • 19讨论染色质开放程度与IR的关系
      • 03植物中的表观遗传
      • 06甲基化在拟南芥开花过程中的研究
      • 20可变剪切的进化
      • 14干旱积累对HIN1蛋白剪切效率的影响
      • 18内含子保留事件中不断变化的范式和调控方式
      • 04从RNA-seq研究可变剪切
      • 16多种RNA-seq策略揭示棉花中高精度的转录态势
      • 07ChIp-seq测序原理 chromatin immunoprecipitation
      • 05甲基化测序数据比对原理
      • 13使用iso-seq分析高粱转录本数据
      • 15POWERDRESS与HDA9相互作用促进去乙酰化
      • 12通过转录与染色质结构的耦合调控可变剪切
      • 英语句子
      • paper list
      • 01多组学数据揭示表观遗传
      • 02A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulat
      • 17可变剪切与表观遗传导致白血病
      • 21smallRNA与DNA甲基化
    • 文章提纲
    • AS多倍化过程中的变化
    • 软件使用
      • 01三代测序Iso-seq
      • Bedtools
      • iso-seq测序2.0版本
      • 02Chip-seq操作流程
      • EMBOSS
      • 05鉴定duplicate gene
      • 07kobas本地进行注释
      • MEME本地化
      • DNA甲基化分析流程
      • stringtie
    • 第7个结果
    • 原始数据处理
      • 01三代测序数据原理
      • 02测序read数目统计
    • 第8个结果
    • 第五次分析
      • isoform水平分析
      • rmats2sashimiplot
      • 可变剪切的鉴定
      • 使用单个样本的数据进行AS分析
    • 表观遗传
    • 保守AS的鉴定
    • 第四次分析了
      • 甲基化计算
      • AS统计
      • 分析IR在各个基因组的保守性
    • 第三次对AS进行统计
      • 鉴定DRMs区域
      • 04
      • 重新下载原始数据进行比对
      • 02
      • 01
    • 第三个结果
    • 原始read的分类
    • 表观数据分析
    • 从RNA-seq研究可变剪切
  • 文献
    • 表观遗传
      • 植物中甲基化机制以及靶向操纵工具
    • 陈增建老师
      • 文章
    • 可变剪切
      • Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants
      • Variant phasing and haplotypic expression from long-read sequencing in maize
      • 02
      • 01
      • 可变剪接的研究进展及展望
      • 06
      • Co-expression networks reveal the tissue-specific regulation of transcription and splicing
    • panGenome
      • 番茄中广泛的结构变异对基因表达和性状改良中的作用
    • TWAS
      • TWAS解读
    • 数量遗传older
      • Reinventing quantitative genetics for plant breeding: something old, something new, something borrow
    • Untitled 1
    • 多倍化
      • Measuring and interpreting transposable element expression
      • Homoeolog expression bias and expression level dominance (ELD) in four tissues of natural allotetrap
    • 转录调控
      • 指导植物RNA聚合酶II转录的‘GPS’
      • 02综述
    • 3D基因组
      • Methods for mapping 3D chromosome architecture
      • 由粘连蛋白介导的人类基因组中染色体loop图谱
      • 经典Hi-C文献
      • 小麦染色质被组装成基因组疆域和转录工厂
      • Lamina-associated domains: peripheral matters and internal affairs
      • Three-dimensional chromatin landscapes in T cell acute lymphoblastic leukemia
      • Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer
      • Evolutionary dynamics of 3D genome architecture following polyploidization in cotton
      • On the existence and functionality of topologically associating domains
    • Untitled
    • GWAS
      • Population Genomic Analysis and De Novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary
  • CRISP Case9
    • sgRNA设计
    • 01编辑效率检测
    • Hi-TOM
    • 02检查单株覆盖度
  • python
    • matplotlib
      • 图片的基本设置
      • 韦恩图
      • 折线图
      • 堆积直方图
      • 散点图
      • imshow绘制热图
    • 爬虫
      • 根据关键字获取对应的基因
      • TE
    • 多进程
    • 基于模块化编程
    • pybedtools
      • 01API
    • 高级特性
      • 列表操作
      • pickle
    • SOS
      • Script of scripts (SOS)
    • python 解析命令行参数
    • 简单实现python多进程
    • gffutils
      • gffutils
    • 多线程读取文件
    • rpy2
      • 在jupyter中调用R代码
    • pandas
      • 取数据
    • pysam
      • 01API接口
  • cottonWeb
    • 初始化项目
    • views
      • login
      • 404页面
      • register页面
    • 后端
      • Hi-C
      • 错误代码合集
      • SequenceServer搭建网页服务
      • 手把手教你搭建JBrowse-初始化应用
      • 优化JBrowse
    • Vue中使用Echarts
    • 2配置axios请求
    • 07搜索框实时推荐
    • 动画效果
    • layout布局
    • mysql
      • 基因操作
    • 路由配置
  • Vue
    • vue-route
      • 路由
    • Vue中发起ajax请求
    • 计算属性和侦听器
    • provide inject
    • 列表渲染
    • 自定义指令
    • 事件处理
    • Vue项目
      • 九宫格实现
      • 使用vue-resource进行ajax请求
      • 在项目中使用v-router
      • 新闻页面
      • 项目迁移
      • 使用Mint UI组件库
    • 案例操作
      • 02基于Github笔记实现
      • 实现购物车功能
      • Vue组建化
      • todomvc实现日程安排
    • 页面组件化
    • Vue 实例化操作
    • vue
    • 动画的渲染
    • 模板语法
    • class & style
    • 13 动画和过渡效果
    • 02guide
    • 深入了解组件化
    • 表单输入绑定
    • 条件渲染v-if
    • vue-chartjs
      • 起步
  • 并行计算
    • 实验室考试
    • 计算圆周率PI
    • 04.forthClass
    • 使用python3中的threading模块进行简单的并行计算
    • test
      • lastTest
      • 111
    • 第三节课作业
    • 05 test
    • 04test
    • 05homework
    • 04homework
    • OpenMP
    • 集群结构
    • CPU核、多线程、多进程
    • 05Class
    • 06class
    • 07class
    • 08class
  • WebPack
    • 打包css文件
    • 基于Webpack进行Vue开发
    • 处理url 图片
    • webpack 打包Vue
    • 基于webpack的路由操作
    • webpack
  • VueCLI
    • 03组件批量注册
    • 04拖拽插件
    • 05axios跨域问题
    • 07时间轴
    • Blast+ 网页实现
    • VueCLI 安装
    • axios请求
  • Script
    • 转录因子结合位点预测
    • BinomTest
  • mysql
    • 常见函数
      • 常见函数
      • 函数
    • 查询
      • 排序查询
      • 联合查询
      • 基本查询语句
    • 字段约束条件
    • SQLyog
    • 修改
      • 修改
    • powerdesigner数据库模型设计
    • 插入
      • 插入数据
    • 事务
      • 事务
    • 添加新用户
    • 视图
      • 视图
  • 文本编辑器
    • vscode 连接数据库
    • Vue模板补齐
    • visual Studio Code
  • source_code
    • Untitled
    • 并行计算
      • 04test
    • 公众号
      • RNA-seq
    • Untitled 1
  • GWAS
    • QQ-plot
  • RNA-seq
    • 01AnalysisFlow
    • 02脚本批量提交
    • 差异表达基因
    • 文献
      • 01SPL1赋予植物热忍受能力
    • 02 建库方式
  • Linux
    • LSF
    • 02诺和致源下载数据
    • 配置阿里yum源
    • linux三剑客
    • 云梯
    • 取文件相同列
    • root基本命令
    • 服务器网站数据搬迁
    • shell脚本激活Conda环境
    • 使用vscode与服务端R交互
    • 如何使用Conda
    • vim常见使用方法
    • oh-my-zsh
    • bash中的字典与数组
  • SNP分子标记
    • vcf文件处理
  • 生信软件
    • samtools
    • bedtools
    • annovar注释SNP
    • HiC-Pro安装
    • Untitled
    • bwa使用
  • Hi-C
    • 软件
      • HiCPlotter安装
      • pre程序
    • 20200102计算共线性区间保守的boundary
    • 20200108保守的TAD
    • PanGenome
      • PanGenome与各个元件进行注释
      • Pan-Genome数据比对
      • 鉴定两个基因组之间重排
  • node
    • mysql
      • 使用Promise封装
      • 基本的SQL语句
      • mysql的增删改查
      • 在node中使用mysql
    • session与cookie保留用户登录状态
    • MongoDB
      • MongoDB中的SQL语句
      • MongoDB 数据库
      • mongoose中一些常用的查询语句
      • :pig_nose: node中使用MongoDB的实例
      • MongoDB关联查询
      • 设计数据模型
    • 保持数据库处于连接状态
    • npm
    • node中路由设计
    • express中中间件的概念
    • art-template模块的用法
    • curd增删改查的使用
    • Promise 异步编程
    • 关于express框架的学习
    • express-session
    • 配置log4js
  • Cell-Ranger
    • count输出文件夹
      • ANALYSIS
      • feature_bc_matrix文件夹
      • Analysis 结果
      • BARcoded BAM
    • CellRanger aggr
    • 10X genomics测序中用到的术语
    • single sample Analysis
    • Cell Ranger count使用手册
  • HOX3
    • 03共表达分析
    • 01RNA-seq
    • 02基因差异表达分析
  • vue-admin
    • 项目目录结构
  • R
    • dplyr
      • dpylr
      • 过滤数据框
  • 系统遗传学
    • 翻译综述
    • 从脊椎动物的视角解析衰老的遗传机制
    • 01
  • eQTL
    • PEER
      • PEER方法
      • 软件使用
    • 群体结构
      • bcftools
  • sQTL
    • HISAT2比对
    • 02数据处理
  • 资源
    • hexo服务搭建
    • 转录因子数据库
    • 前端资源
    • 01 优雅的PPT设计
    • 文章书写规范
  • SVG
    • 01起步
  • 王悦瑾
    • Bash练习题
    • Bash脚本
    • 9_28起步
  • ES6
    • 模板字符串
    • promise源码解析
    • 01
  • scRNAseq
    • 干细胞不对称分裂
      • Root stem cell niche organizer specification by molecular convergence of PLETHORA and SCARECROW tran
    • 茉莉酸代谢
    • 老年痴呆
  • 多倍体进化
    • 棉花进化
    • 棉属A基因组的起源与进化
  • Vuex
    • 解构前端登录请求
    • VueX
  • ElementUI
    • 源码学习
      • 01drawer
    • Element UI:rocket:
  • reference周记
    • 第一期
    • test
  • 苏柃
    • Bash练习
Powered by GitBook
On this page
  • 1.背景
  • 2.影响可变剪切的因素
  • 3.可变剪切的研究思路
  • 4.在研究棉花、或者多倍体植物带来的思考
  • 文献解读
  • 1.背景部分
  • 借助于测序技术的发展
  • 2.影响可变剪切的因素
  • 3.可变剪切的研究思路
  • 4.在棉花或多倍体物种中的应用

Was this helpful?

  1. 文献
  2. 可变剪切

可变剪接的研究进展及展望

1.背景

  • 可变剪接的类型,和形成机制

  • 在动植物中的研究进展

  • 可变剪切的作用,增加蛋白组的复杂性,调控基因表达

  • 全长转录组测序有助于鉴定AS

2.影响可变剪切的因素

  • 基因转录过程中的动力学耦合

  • 表观遗传(DNA甲基化、组蛋白修饰、TE)在基因转录调控中的作用

  • lnRNA 、miRNA

3.可变剪切的研究思路

  • 可变剪切在基因家族和同源基因间的进化

  • 结合sp-QTL、共表达网络,在群体水平研究可变剪接,分析组织不同发育阶段

  • 结合基因编辑技术,对可变剪接的功能进行验证

4.在研究棉花、或者多倍体植物带来的思考

文献解读

1.背景部分

基因可变剪接的类型

  1. Post-transcriptional Processing of mRNA in Neurons: The Vestiges of the RNA World Drive Transcriptome Diversity

蛋白质编码基因的转录受到启动子的调控,在包含启动子的转录起始区域TSS,通过招募转录因子、RNA聚合酶II;起始基因的转录。在转录过程中,包含多个外显子的pre-mRN通过剪切机制去除内含子,连接两端的外显子;而在这个过程中通过可变剪接包含或者排除特定的exon形成不同类型的转录本;在细胞核内,pre-mRNA还经历了5’加帽,3‘端多聚腺苷化过程。因此同一个基因可以通过选择不同的转录起始位点、转录终止位点、不同的剪接形式,产生多种mRNA isoform;而我们今天主要探讨的就是AS在基因转录过程形成、以及对应的调控机理。

对于一些剪切位点的选择,将可能导致IR、ES等剪切事件;使得单个基因产生多个isoforms

在基因的选择性剪接中,最主要的选择剪切模式包含以下四种:

  • IR 内含子保留

  • ES 外显子跳跃

  • AltA 可变的5端

  • AltD 可变的3端

在人类中高达92%-94%的多外显子基因经历AS事件,而植物中有21.2%~63%的基因经历AS事件。

在人类和动物中SE事件所占所有AS 事件的40%,而在植物中IR事件占据AS事件的40%;

这可能是由于动物中的大部分内含子都比植物中的内含子短,导致剪切复合体识别的差异:

  • 内含子识别模式

  • 外显子识别模式

Perspective on Alternative Splicing and Proteome Complexity in Plants

对于多细胞生物来说,在正确的时间、正确的位置,产生正确的蛋白质对于生物的生长发育至关重要;蛋白质的合成受到多种因素的调节,而其中基因的转录调控是其中重要的一种。

AS翻译出具有功能的蛋白,增加蛋白质的多样性,响应环境刺激

植物在胁迫条件下,基因通过可变剪切调节转录组的多样性和蛋白组的复杂性来响应外界的变化。在人类的研究中表明AS的存在显著的增加了蛋白质的多样性,但是在各个蛋白组组学的研究中很少检测到由AS isoforms编码出差异的蛋白;这个结果相互矛盾。

AS同样能够导致编码框的偏移,使得翻译出截断的蛋白质;这些蛋白质可能仍旧存在一些功能模块,但是缺失一些功能域或者蛋白质修饰位点。可能会与正常蛋白有竞争效应。

  • 质谱仪在区分AS isofrom蛋白方面的敏感性比较差

  • 并不是所有的AS isoform都具有生物学功能

Complexity of the Alternative Splicing Landscape in Plants

AS的另一个作用:因为AS产生的IR事件大多数是NMD的靶标,通过NMD将AS转录本降解,调节稳定转录本和un-stable转录本的数量。因此AS能够影响基因的转录丰度。

基因的转录和翻译都需要消耗巨大的能力,尽管如此植物在非胁迫条件下还是转录出大量的AS isoform。如果AS的作用是翻译出响应胁迫的蛋白质的话,植物就没有必要在胁迫降低时,仍旧把大量AS的转录本进行翻译浪费能量。

好在,细胞质中存在存在一种无意义介导的降解机制(NMD);通过识别提前终止的密码子,将新和成的mRNA降解;调节基因的转录水平、或者快速响应外界环境的刺激。

RNA sequencing: the teenage years

1.随着三代全长转录组测序技术的发展和应用,使得我们可以直接对整个转录本进行测序,避免了由于short read在转录本组装过程中不准确的问题,更加准确的鉴定基因的AS事件,甚至于可以借助Direct-seq 技术直接对RNA进行测序(不经过反转录,从而保守了mRNA上的修饰)。

借助于测序技术的发展

在一些物种中对于可变剪接的研究也变得更加的准确与方便。在高粱中首次使用PacBio全长转录组测序技术对AS、APA进行分析,与已有的注释相比Iso-seq显著的改善了基因的注释,找到了更多的剪切事件。

使用Iso-seq测序,比较了玉米和高粱在11个组织中AS的差异,表明亚基因组在isofrom 的产生上不存在差异。同时与旧的基因相比,年轻的基因拥有更少的转录本数、基因、ORF长度也更短;

在油菜中结合Iso-seq和Illumina 二代测序技术对全基因组的AS事件进行鉴定表明,31591个AS事件坐落在ORF区域,并且可能导致CDS编码框的改变,大约69%的AS事件是组织特异性的。

2.影响可变剪切的因素

剪切和RNA共转录部分

1.Splicing and transcription touch base: co-transcriptional spliceosome assembly and function

RNA的剪切主要发生在转录过`程中,通过将剪接复合体逐步的组装到新生的RNA上,从而实现催化剪接功能。

并且剪切复合体与RNA聚合酶II的物理位置,非常接近说明剪接与转录发生的时间很接近;

转录延伸和暂停会影响剪切复合体识别保守的位点,影响剪切复合体的组装;一些表观因素,DNA甲基化、组蛋白修饰等会影响转录动力学,改变转录的延伸速率。

转录后的剪切

Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants

富集结合在染色质上的RNA,进行测序可以同时在全基因组水平检测转录本的剪切状态、RNA聚合酶II的位置、多聚腺苷酸化;分析发现大量腺苷酸化的mRNA包含有未剪切的内含子,而这些未剪切的内含子在细胞质中的mRNA是缺失的;这些转录后剪切的转录本受到剪切蛋白PRMT5 and SKIP 的调控;

核小体定位

  1. Nucleosome positioning as a determinant of exon recognition

外显子处的核小体密度显著性的高于内含子,通过将外显子剪切水平与核小体的分布进行相关性分析,说明核小体在染色体水平上的位置定义了外显子。同时核小体与exon的在长度上接近,维持在147bp作用,并且exon受到强烈的选择压,认为exon子处富集核小体的作用是保护这段用功能的DNA序列

DNA甲基化、转座子

  1. The alternative role of DNA methylation in splicing regulation

(筛选那些exon和两侧intron在GC含量上不存在差异的exon)发现外显子相比于两侧的剪切位点处有着更高水平的甲基化,

DNA甲基化调控AS的两种机制:

  • CTCG结合因子和CpG甲基化结合蛋白MeCP2影响RNA聚合酶II的延伸

  • 通过HP1异染色质蛋白形成蛋白桥,招募剪切因子进行剪接

组蛋白修饰

  1. Regulation of alternative splicing by local histone modifications: potential roles for RNA-guided mechanisms

组蛋白的甲基化和乙酰化被广泛的研究,组蛋白修饰在DNA转录过程中起着重要的作用

H3K9me3 作为异染色质结合蛋白HP1结合位点,招募剪切因子调控可变剪接,一般乙酰化的组蛋白修饰标志着更加开放的染色质区域,因此组蛋白乙酰化区域,改变局部的RNA聚合酶II的延伸速率使得第18个exon被skip,没有被剪切

总结

总的来说,转录和剪切同时进行的动力学效应,容易让人想到表观遗传通过影响染色体结构,RNA聚合酶II的延伸速度;从而参与到剪切调控。

染色体水平上的改变,例如核小体定位、组蛋白修饰、DNA甲基化,以及RNA二级结构、和反式调节因子SREs共同调控基因的剪切。因此在研究AS的时候就非常又必要整合多个组学的数据,解析植物中的剪切调控机制。

3.可变剪切的研究思路

AS在和gene duplicate

  1. Divergence of duplicated genes by repeated partitioning of splice forms and subcellular localization

基因的duplicate 和AS都有助于蛋白组的多样化,因此植物在多倍化过程中;duplicate基因的AS在进化中是否会有差异。

例如在拟南芥等多种被子植物中分析APX(抗坏血酸过氧化物酶),重复基因中转录本的情况。

  1. Genome-Wide Association Analyses Reveal the Importance of Alternative Splicing in Diversifying Gene Function and Regulating Phenotypic Variation in Maize

    在包含368个玉米自交系群体中,进行sQTL(剪切数量性状基因座)分析,在定位到的大多数sQTL,不同基因型的主要转录本的表达ratio没有改变。同时转录本和mRNA总表达的差异是使用不同的顺式元件调节的结果。(sQTL和eQTL进行比较 figure 8A);说明仅仅从基因总的表达量来研究表型,仍旧还有很多转录本的遗传变异没有鉴定到。

构建基因共表达网络

  1. Co-expression networks reveal the tissue-specific regulation of transcription and splicing

大多数基因共表达网络,往往是在单个组织中基于基因的总的表达量构建的genee-gene间互作的网络。在这篇文献中,基于基因的表达量和转录本的相对表达量在GTEx项目多个组织中同时用于构建基因的表达网络,进一步的加深了对于基因转录调控和基因转录后调控的理解。

Genetic Control of Expression and Splicing in Developing Human Brain Informs Disease Mechanisms

大部分基因组的研究鉴定到的一些致病位点主要位于位于非编码区、高度连锁区域。这使得对应疾病的致病机理和功能解析非常困难;由于这些非编码区的变异主要富集在一些调控区域、保守区域,它们就可能起到调节基因表达和剪切的功能。

eQTL在不同组织、不同时期间存在差异;如果在调控细胞发育的关键节点,调控区域发生变异将会导致疾病的发生。作者在原先的基础上搞了一个更大的群体,同时加上了sQL分析;对比了产前和成年人大脑的遗传调控,表明两个时期间存在大量的差异。eQTL和sQTL对于疾病的都有非常重要的贡献,并且表现出非重叠的模式。将eQTL、sQTL分别与TWAS进行整合,鉴定到一些未发现的新的机制。

sQTL、eQTL以及共表达网络在脑组织不同发育阶段的研究。

作者通过对201份脑组织样本分析

位点。通过TWAS将eQTL和sQTL与表型进行关联分析,鉴定到数十个候选的致病基因,阐述精神分裂症疾病在脑组织不同发育阶段的共有和时期特异性的调控机制。

基因共表达网络分析,表明精神分裂和自闭症影响不同发育基因的共表达module

研究表明在大脑的不同发育阶段,调控基因表达和剪接的变异存在很大的不同;并且剪切变异所带来的疾病风险比表达变异大得多的多。

1.数据来源

对233个产前大脑组织进行RNA-seq和genotyping,进过质量过滤和标准化最终得到201份大脑组织的RNA-seq和genotyping样。

2.eQTL的鉴定

鉴定到7,962个eQTL位点其中20%的eQTL在转录起始位点的10KB范围内,表明启动子区域的变异会对应基因的表达有着巨大的影响,并且eQTL位点与其他调控区域例如ATAC、Hi-C存在显著性的重叠,表明eSNP既存在近端也存在远端区域调控靶基因的表达。对eQTL对应的eSNP进行注释,表明这些eSNP主要位于TSSs,启动子、增强子等调控区域。

探讨eQTL位点附近是否会有TF或者DNA binding蛋白的结合位点,显著的富集一些与大脑发育相关的转录因子和DP。

挑选了其中的一个转录因子CHD8,和CHD8的结合的eSNP,发现这个结合位点eSNP不同的基因型,会导致靶基因SRR表达水平的改变,同时敲除CHD8转录因子得到了同样的结论,说明CHD8转录因子可能通过结合到eSNP附近,调节基因的表达

3.sQTLs的鉴定 RNA剪切的异常同样会导致疾病的发生,同时在人类脑组织中还没有系统性的分析基因的剪切调控,因此进行了sQTL的分析。在鉴定到的4,635个sQTL其中64%的sQTL位于基因body区域,与eQTL相比sQTL在启动子和转录区域更加富集。

为了评估鉴定到的sQTL的真实性:

对RNA结合蛋白(剪切调节因子)在sSNP出的富集进行分析,发现36种实验证明的RBP显著性的富集在sSNP区域。对TRMT1这个基因进行验证,发现SRRM4(RNA结合蛋白在超表达会改变内含子的剪切比率PSI),同时不同基因型间这个内含子的剪切比例存在差异。

比较eQTL与sQTL靶基因的重叠情况:

有67%的sGene会影响基因的表达,而仅仅只有20%的eGene会影响基因的剪切,同时同一个基因的eSNP和sSNP在存在一定间隔,说明基因的表达调控和剪接调控受到独立的监管。

4.eQTL效应与组织特异性

不同组织中表达会发生变化,因此在进行eQTL分析时也会鉴定到不同的eSNP。作者分析了不同组织间eQTL效应的大小发现,在多个组织鉴定到的eQTL对基因表达量的效应显著性的低于组织特异性的eQTL效应;这说明组织特异性的调控模式的改变相比于蛋白质编码区域的改变,对生物的破坏性更小。

之前对于染色质开放性的研究,表明调控SCZ(精神分裂症)的遗传变异主要富集在大脑发育早期的调控区域,比较了不同发育阶段中的QTL对SCZ的遗传力,比较发现不同时期的QTL对于SCZ都有特定的解释力,同时又相互补充。

5.比较不同发育阶段的eQTL

在大脑发育中期和GTEx项目成年人的大脑中,鉴定到2532个重叠的eGene,与另外一个更大的项目,发现仍旧有1393个在大脑发育早期的eGene;同时对sGene进行比较,表明许多剪切事件是时期特异性的,可能对组织更大。

6.eQTL与表达调控网络

使用基因的表达量,构建加权共表达网络,鉴定到了19个基因module,其中的6个module基因显著的富集在一些与大脑发育相关的GO通路当中。将共表达中每个module中的eQTL与GWAS进行QQ-plot,发现一些显著性的module。当与共表达模块整合在一起时,可以发现eQTL可能能够通过调节一些具有相似功能的基因来改变基因的表型。

7.整合cis-QTL与GWAS鉴定新的候选基因

为了鉴定与疾病相关的候选基因,作者整合cis-eQTL、cis-sQTL和GWAS的数据进行TWAS分析,鉴定其表达量、剪切与表型相关的基因。一共鉴定到62个基因和91个introns与精神分裂症存在显著关联。为了减少由于连锁或者基因多效性带来的假阳性,作者使用不同方法进一步对候选基因和intron进行筛选,最终鉴定到8个潜在的致病基因和6个intron.

在不同时期鉴定到的候选基因、intron进行比较和功能验证。

结合基因编辑技术对可变剪切进行验证

  1. CRISPR-Mediated Base Editing Enables Efficient Disruption of Eukaryotic Genes through Induction of STOP Codons

    传统的CRISPR通过打断DNA双链,实现对基因的敲除;单碱基编辑通过识别四种密码子(CAA、CAG、CGA、TGG)实现碱基替换引入终止密码子,同时可以使用RFLP在群体和细胞中快速检测iSTOP的编辑效果。在8种真核生物中97~99%的基因都能找到iSTOP的靶标

  2. CRISPR-SKIP: programmable gene splicing with single base editors (改变内含子和外显子边界保守序列,影响剪切复合体的组装实现对可变剪切的控制与调节)

4.在棉花或多倍体物种中的应用

  • 在进化和多倍化的角度,分析基因的AS与基因加倍

  • AS在亚基因组间的差异,同时与染色质、表观遗传等多组学数据结合

  • AS在在纤维不同发育阶段的动态变化

  • 结合eQTL、sQTL在群体水平,分析基因的转录调控和剪接调控对于表型的作用

AS的进化

Previous01Next06

Last updated 4 years ago

Was this helpful?

可变剪接类型
剪切事件在各个物种中的b比例
改变蛋白组
可变剪切调控基因表达
测序技术的发展
共转录
转录后剪切
核小体的定位
外显子相比于内含子有着更高的甲基化水平
组蛋白修饰在DNA转录中的研究
组蛋白修饰对于DNA转录的作用
转录动力学影响可变剪切
duplicate gene的AS情况
cis-sQTL和cis-eQTL
构建组织特异性调控网络
数据来源
鉴定eQTL
sQTL的鉴定
eQTL效应与组织特异性
eQTL与共表达网络
与TWAS结合
引入终止密码
改变内含子边界序列

https://www.nature.com/articles/nrg1896