🎨
booknote
  • Zpliu'Booknote
  • ggplot2
    • 不继承原有数据
    • Untitled Folder 1
      • 直方图绘制
    • 02基于Github笔记实现
    • 回归分析
    • 饼图
    • Theme函数
    • 直方图
    • 分面
    • pheatmap
    • 折线图
    • 桑基图
    • GO富集分析图
    • jupyter内使用R
    • 维恩图
    • 自定义图例
    • ggridges 山峦图
    • GO气泡图
    • 散点图
    • 从数据框中计算频率
    • 箱型图
  • 前端操作
    • 实例练习
      • 动态搜索网页
        • 后端
          • Node 服务框架
          • primer数据表的增删改查
          • 前端post请求
          • login 验证
          • Vue模板
            • Vue-router前端渲染
            • main.vue
          • 基于cookie登录验证
          • 使用mysql包进行数据库的交互
          • 数据库表
            • 学生信息表
            • 用户登录表
            • mysql 事务
            • 教师表
            • 引物表
          • mysql服务
          • html模板页面
            • 错误模板页
          • 08文件上传与下载
        • 解决webpack打包后文件过大问题
        • 前端
          • vue
            • 基于element-ui框架
            • 06 个人主页
            • 08上传组件el-upload
            • element-ui
            • Vue 构建前端框架
            • login登录界面
            • 07表格多选
            • show-data页面
          • vue-cookie
          • vue-router
            • 路由组件传参
        • Appach代理服务转发node
      • pie-progress
        • 01
      • 登录界面
      • Untitled
    • JavaScript
      • fasta文件校验
      • codewar中的练习题
      • 6kyu
      • chapter03
        • 数据类型
      • tweenjs
    • css
      • CSS布局
      • 02定位
    • 前端使用ajax进行异步请求
    • gitbook
    • html
      • 03表格
      • Vue星空
    • Log for study
  • 可变剪切
    • 第六次分析
      • 设计引物
      • 多倍化过程中的变化3
      • 不同棉种间AS的差异
      • At与Dt中不存在保守转录本的基因
      • AS调控基因表达
      • 多倍化过程中变化2
      • 可变剪切统计
      • 可变剪切的进化分析
      • 保守AS模式的鉴定
      • 提纲
      • 可变剪切的翻译分析
      • 多倍化过程中isoform的变化
      • 表观遗传在AS中的作用
      • 全长转录本数据的统计
      • 表观遗传在AS中的作用2
    • 03表观遗传与可变剪切
    • 数据处理流程
      • 计算同源基因间AS的保守程度
      • 重新开始鉴定AS.md
      • 统计IR保守性比例
      • 基因分类
      • 20200111可变剪切数目统计
      • 完全保守的基因对
      • 20200315
      • 20200214
      • 第三个结果
      • 20191230对AS类型进行定义
      • AS保守程度的统计
      • 20200219合并IR
      • 20200320
      • IR事件保守的长度
      • 分析同源基因中发生IR事件的频率
      • 保守的IR的长度统计
      • 筛选基因用于GO富集分析
      • 2020102把没有发生剪切事件的位置找出来
      • 对剪切事件进行分类
      • 06比较不同棉种中isform的差异
      • 甲基化数据处理
      • 寻找motif
      • 根据IR的保守程度对基因进行GO富集分析
      • 分析同源基因间可变剪切的差异
      • 基于前面已经分好的类进行统计
      • 寻找同源基因对应的位点
      • 对同源基因的剪切事件进行分类.md
      • 分析染色体上各种特征
      • HIN1下游调控基因的分析
      • intron 分布
      • 20200102GO富集分析
      • 01全长转录组数据处理
      • 甲基化重复间的处理
    • 文献理解
      • 10核小体定位决定外显子识别
      • 22
      • 09梨树中两个亚基因组经历unbiased 进化
      • 11RNA介导的局部染色质修饰对可变剪切的调控
      • 19讨论染色质开放程度与IR的关系
      • 03植物中的表观遗传
      • 06甲基化在拟南芥开花过程中的研究
      • 20可变剪切的进化
      • 14干旱积累对HIN1蛋白剪切效率的影响
      • 18内含子保留事件中不断变化的范式和调控方式
      • 04从RNA-seq研究可变剪切
      • 16多种RNA-seq策略揭示棉花中高精度的转录态势
      • 07ChIp-seq测序原理 chromatin immunoprecipitation
      • 05甲基化测序数据比对原理
      • 13使用iso-seq分析高粱转录本数据
      • 15POWERDRESS与HDA9相互作用促进去乙酰化
      • 12通过转录与染色质结构的耦合调控可变剪切
      • 英语句子
      • paper list
      • 01多组学数据揭示表观遗传
      • 02A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulat
      • 17可变剪切与表观遗传导致白血病
      • 21smallRNA与DNA甲基化
    • 文章提纲
    • AS多倍化过程中的变化
    • 软件使用
      • 01三代测序Iso-seq
      • Bedtools
      • iso-seq测序2.0版本
      • 02Chip-seq操作流程
      • EMBOSS
      • 05鉴定duplicate gene
      • 07kobas本地进行注释
      • MEME本地化
      • DNA甲基化分析流程
      • stringtie
    • 第7个结果
    • 原始数据处理
      • 01三代测序数据原理
      • 02测序read数目统计
    • 第8个结果
    • 第五次分析
      • isoform水平分析
      • rmats2sashimiplot
      • 可变剪切的鉴定
      • 使用单个样本的数据进行AS分析
    • 表观遗传
    • 保守AS的鉴定
    • 第四次分析了
      • 甲基化计算
      • AS统计
      • 分析IR在各个基因组的保守性
    • 第三次对AS进行统计
      • 鉴定DRMs区域
      • 04
      • 重新下载原始数据进行比对
      • 02
      • 01
    • 第三个结果
    • 原始read的分类
    • 表观数据分析
    • 从RNA-seq研究可变剪切
  • 文献
    • 表观遗传
      • 植物中甲基化机制以及靶向操纵工具
    • 陈增建老师
      • 文章
    • 可变剪切
      • Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants
      • Variant phasing and haplotypic expression from long-read sequencing in maize
      • 02
      • 01
      • 可变剪接的研究进展及展望
      • 06
      • Co-expression networks reveal the tissue-specific regulation of transcription and splicing
    • panGenome
      • 番茄中广泛的结构变异对基因表达和性状改良中的作用
    • TWAS
      • TWAS解读
    • 数量遗传older
      • Reinventing quantitative genetics for plant breeding: something old, something new, something borrow
    • Untitled 1
    • 多倍化
      • Measuring and interpreting transposable element expression
      • Homoeolog expression bias and expression level dominance (ELD) in four tissues of natural allotetrap
    • 转录调控
      • 指导植物RNA聚合酶II转录的‘GPS’
      • 02综述
    • 3D基因组
      • Methods for mapping 3D chromosome architecture
      • 由粘连蛋白介导的人类基因组中染色体loop图谱
      • 经典Hi-C文献
      • 小麦染色质被组装成基因组疆域和转录工厂
      • Lamina-associated domains: peripheral matters and internal affairs
      • Three-dimensional chromatin landscapes in T cell acute lymphoblastic leukemia
      • Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer
      • Evolutionary dynamics of 3D genome architecture following polyploidization in cotton
      • On the existence and functionality of topologically associating domains
    • Untitled
    • GWAS
      • Population Genomic Analysis and De Novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary
  • CRISP Case9
    • sgRNA设计
    • 01编辑效率检测
    • Hi-TOM
    • 02检查单株覆盖度
  • python
    • matplotlib
      • 图片的基本设置
      • 韦恩图
      • 折线图
      • 堆积直方图
      • 散点图
      • imshow绘制热图
    • 爬虫
      • 根据关键字获取对应的基因
      • TE
    • 多进程
    • 基于模块化编程
    • pybedtools
      • 01API
    • 高级特性
      • 列表操作
      • pickle
    • SOS
      • Script of scripts (SOS)
    • python 解析命令行参数
    • 简单实现python多进程
    • gffutils
      • gffutils
    • 多线程读取文件
    • rpy2
      • 在jupyter中调用R代码
    • pandas
      • 取数据
    • pysam
      • 01API接口
  • cottonWeb
    • 初始化项目
    • views
      • login
      • 404页面
      • register页面
    • 后端
      • Hi-C
      • 错误代码合集
      • SequenceServer搭建网页服务
      • 手把手教你搭建JBrowse-初始化应用
      • 优化JBrowse
    • Vue中使用Echarts
    • 2配置axios请求
    • 07搜索框实时推荐
    • 动画效果
    • layout布局
    • mysql
      • 基因操作
    • 路由配置
  • Vue
    • vue-route
      • 路由
    • Vue中发起ajax请求
    • 计算属性和侦听器
    • provide inject
    • 列表渲染
    • 自定义指令
    • 事件处理
    • Vue项目
      • 九宫格实现
      • 使用vue-resource进行ajax请求
      • 在项目中使用v-router
      • 新闻页面
      • 项目迁移
      • 使用Mint UI组件库
    • 案例操作
      • 02基于Github笔记实现
      • 实现购物车功能
      • Vue组建化
      • todomvc实现日程安排
    • 页面组件化
    • Vue 实例化操作
    • vue
    • 动画的渲染
    • 模板语法
    • class & style
    • 13 动画和过渡效果
    • 02guide
    • 深入了解组件化
    • 表单输入绑定
    • 条件渲染v-if
    • vue-chartjs
      • 起步
  • 并行计算
    • 实验室考试
    • 计算圆周率PI
    • 04.forthClass
    • 使用python3中的threading模块进行简单的并行计算
    • test
      • lastTest
      • 111
    • 第三节课作业
    • 05 test
    • 04test
    • 05homework
    • 04homework
    • OpenMP
    • 集群结构
    • CPU核、多线程、多进程
    • 05Class
    • 06class
    • 07class
    • 08class
  • WebPack
    • 打包css文件
    • 基于Webpack进行Vue开发
    • 处理url 图片
    • webpack 打包Vue
    • 基于webpack的路由操作
    • webpack
  • VueCLI
    • 03组件批量注册
    • 04拖拽插件
    • 05axios跨域问题
    • 07时间轴
    • Blast+ 网页实现
    • VueCLI 安装
    • axios请求
  • Script
    • 转录因子结合位点预测
    • BinomTest
  • mysql
    • 常见函数
      • 常见函数
      • 函数
    • 查询
      • 排序查询
      • 联合查询
      • 基本查询语句
    • 字段约束条件
    • SQLyog
    • 修改
      • 修改
    • powerdesigner数据库模型设计
    • 插入
      • 插入数据
    • 事务
      • 事务
    • 添加新用户
    • 视图
      • 视图
  • 文本编辑器
    • vscode 连接数据库
    • Vue模板补齐
    • visual Studio Code
  • source_code
    • Untitled
    • 并行计算
      • 04test
    • 公众号
      • RNA-seq
    • Untitled 1
  • GWAS
    • QQ-plot
  • RNA-seq
    • 01AnalysisFlow
    • 02脚本批量提交
    • 差异表达基因
    • 文献
      • 01SPL1赋予植物热忍受能力
    • 02 建库方式
  • Linux
    • LSF
    • 02诺和致源下载数据
    • 配置阿里yum源
    • linux三剑客
    • 云梯
    • 取文件相同列
    • root基本命令
    • 服务器网站数据搬迁
    • shell脚本激活Conda环境
    • 使用vscode与服务端R交互
    • 如何使用Conda
    • vim常见使用方法
    • oh-my-zsh
    • bash中的字典与数组
  • SNP分子标记
    • vcf文件处理
  • 生信软件
    • samtools
    • bedtools
    • annovar注释SNP
    • HiC-Pro安装
    • Untitled
    • bwa使用
  • Hi-C
    • 软件
      • HiCPlotter安装
      • pre程序
    • 20200102计算共线性区间保守的boundary
    • 20200108保守的TAD
    • PanGenome
      • PanGenome与各个元件进行注释
      • Pan-Genome数据比对
      • 鉴定两个基因组之间重排
  • node
    • mysql
      • 使用Promise封装
      • 基本的SQL语句
      • mysql的增删改查
      • 在node中使用mysql
    • session与cookie保留用户登录状态
    • MongoDB
      • MongoDB中的SQL语句
      • MongoDB 数据库
      • mongoose中一些常用的查询语句
      • :pig_nose: node中使用MongoDB的实例
      • MongoDB关联查询
      • 设计数据模型
    • 保持数据库处于连接状态
    • npm
    • node中路由设计
    • express中中间件的概念
    • art-template模块的用法
    • curd增删改查的使用
    • Promise 异步编程
    • 关于express框架的学习
    • express-session
    • 配置log4js
  • Cell-Ranger
    • count输出文件夹
      • ANALYSIS
      • feature_bc_matrix文件夹
      • Analysis 结果
      • BARcoded BAM
    • CellRanger aggr
    • 10X genomics测序中用到的术语
    • single sample Analysis
    • Cell Ranger count使用手册
  • HOX3
    • 03共表达分析
    • 01RNA-seq
    • 02基因差异表达分析
  • vue-admin
    • 项目目录结构
  • R
    • dplyr
      • dpylr
      • 过滤数据框
  • 系统遗传学
    • 翻译综述
    • 从脊椎动物的视角解析衰老的遗传机制
    • 01
  • eQTL
    • PEER
      • PEER方法
      • 软件使用
    • 群体结构
      • bcftools
  • sQTL
    • HISAT2比对
    • 02数据处理
  • 资源
    • hexo服务搭建
    • 转录因子数据库
    • 前端资源
    • 01 优雅的PPT设计
    • 文章书写规范
  • SVG
    • 01起步
  • 王悦瑾
    • Bash练习题
    • Bash脚本
    • 9_28起步
  • ES6
    • 模板字符串
    • promise源码解析
    • 01
  • scRNAseq
    • 干细胞不对称分裂
      • Root stem cell niche organizer specification by molecular convergence of PLETHORA and SCARECROW tran
    • 茉莉酸代谢
    • 老年痴呆
  • 多倍体进化
    • 棉花进化
    • 棉属A基因组的起源与进化
  • Vuex
    • 解构前端登录请求
    • VueX
  • ElementUI
    • 源码学习
      • 01drawer
    • Element UI:rocket:
  • reference周记
    • 第一期
    • test
  • 苏柃
    • Bash练习
Powered by GitBook
On this page
  • 本文将主要围绕以下几点进行综述
  • 背景
  • 转座子与进化
  • TEs的一些特征
  • 4.测量转座子的表达
  • 全基因组水平分析TE的表达
  • 5.1比对

Was this helpful?

  1. 文献
  2. 多倍化

Measuring and interpreting transposable element expression

转座子作为一种插入突变,增加了基因组的可塑性,影响物种的进化与驯化,同时对个体的生理或者疾病产生影响。对转座子表达的测定不仅能帮助我们了解到转座子活跃的时间和位置,同时理解TE的表达是如何改变基因的表达、染色质的可及性及细胞信号途径。通过RNA-seq的全基因组转录组分析来看,大多数计算工具会把TE驱动的表达进行丢弃或者误判。随着对于鉴定转座子表达的技术不断改进,发现TE在嵌合基因、普通转录本、TE驱动的转录本中均具有活性。本文将围绕转录子的表达进行讨论,主要包括转座子的比对、插入以及序列高度重复,不同转录子转录图谱的差异。

本文将主要围绕以下几点进行综述

  1. TE的自身特性阻碍对TE表达的研究

  2. 对于TE表达测定和验证的实验技术

  3. 对于新算法和长片段测序技术在TE研究应用中的展望。

背景

转座子是一种可移动的基因元件,占据真核生物基因组的大部分;在线虫中占据12%而在玉米中达到85%之多。

基因组的大小很大程度上反应了转座子的复制情况

转座子是导致插入突变产生的主要原因,是基因组进化的主要动力。它们对宿主适应性、疾病的影响已经广泛被报道。

转座子类型的区分主要在它们的复制方式上的差异,其中最主要的区别就是逆转录转座子和DNA转座子。

逆转录转座子:

  1. TE进行转录

  2. RNA模板可以进行翻译形成逆转录蛋白和形成一份新的D'NA拷贝,从而插入到宿组基因组中。

DNA转座子:

  1. 转录对于DNA转座子同样很重要

  2. 转录出转座酶用于切割和对转座子的重新整合

因此转录活性都是两种转座子的移动的前提。

转座子与进化

许多转座子是一种分子化石,是几百万年前转座子浪潮的遗留产物。例如一些古老的转座子中,积累了一些截断或者使其失去活性的突变,导致其在现在的基因组中不能够移动了;但是仍旧可以进行转录。可能会对宿主基因组产生潜在的影响。例如有些转座子通过自身的转录表达,从而影响TE的复制和插入,从而调节基因的表达和染色质的可及性。

在大多数例子中,长转座子的表达通常是由内部的启动子所驱动;并且这个启动子随着转座子一起移动,从而确保其在所插入的位置能够表达,不依赖于其他启动子。然而由于转座子同时还能够携带多种顺式调节元件,例如启动子、剪接受体和供体位点,多聚腺苷酸化位点等;当被片段化后插入到基因区域是它的表达与基因的表达通常交织在一起。因此这种自主的TE单元经常与其多插入的基因出现共转录的现象。

总的来说,TE在基因组内是重复且分散的分布着,并且许多转座子与基因发生重叠,从而使得转座子可以通过TE自带的启动子或者基因的启动子,启动TE的转录,形成复杂的转座子转录起始。这种特效也阻碍了通过基因的表达来分析TE的表达,例如传统的(RT-qPCRs,RNA-seq等)。然而随着,多组学的研究、测序技术的发展以及算法的改进,进一步能够准确的量化TE的表达。

TEs的一些特征

​ 1.TE序列是高度重复且在基因组分布广泛的,当整合到一个基因组时,它新产生的TE与其原来的TE具有相同的来源、祖先和拷贝。但是两个TE之间的序列还是会有所差异,由于缺乏正向选择,TE之间会由于随机突变或者其他形式的改变而发生变化。

因此可以通过比较同一个TE family中突变的多少。判断它在进化中的时间。分为young and old family;但是这个在不同物种间是相对的。例如在人类中L1转座子是一个young的转座子家族,而在灵长类动物中L1大约3~200百万年前完成扩张。

在不同物种中,同一个转座子家族活跃的转座子数目,以及转座子内活跃的祖先转座子数目是存在差异的

​ 在人类中只有年轻的转座子类型Alu、L1和SVA(逆转录转座子),仍旧保持活跃;然而Alu和SVA是非编码转座子,依赖于L1编码出逆转录酶;并且在人类基因组成千上万的L1转座子中,只有80-100个L1具有转录活性。哺乳动物中大多数逆转座子在转座子浪潮中进行扩张,然而对应的祖先转座子后来被沉默和发生突变。

​ 在其他物种中,许多转座子家族似乎都同时保持活跃。但是在果蝇中当转座家族的拷贝数没有人类中多,可能是其形成的时间较短同时基因组正经历快速扩张的过程。

​ 总的来说,old转座子,累积了很多突变,在进货过程中发生了分化而变得独一无二;而young的转座子具有很多个拷贝。

​ 2.转座子在不同物种中是具有多态性;转座子的活跃会在有限的群体或者物种中的同一个位点形成转座子的差异,导致转座子的出现或者缺失;甚至只会在单个个体中出现。例如在人类中约20%的可遗传的结构变异是由新转座子的插入导致的,仅仅L1转座子在两个个体间就存着285个位点的不同。这种多态性在植物、动物群体都是相当多的。

​ 在拟南芥中,TE是比较活跃的,几百个TE家族存着几千中插入的多态性。并且如果TE在群体里面多态性比较低,也可以认为他们可能是种群内最近形成的插入事件。TE的移动受到环境、遗传因素以及选择亚的作用,并且具有有害的作用跟疾病的发生有关。

​ 3.转座子的转录本是具有多样性的。转座子的转录本被当做逆转录过程中的模板。因此逆转座子转录也是逆转座过程的起点。TE合成的RNA也被称作为全长的基因组转录本。在LTRs或者ERVs(内源逆转录病毒)内部包含启动子,通过招募RNA聚合酶II,起始TE的转录,或者位于LINEs转座子上游的5‘UTR区域。转座子可以在识别到位于LTR 3’区域的多聚腺苷酸信号后,终止TE的转录;但有时候终止也会发生在下游的侧翼序列上。因此转座子延伸的长度将取决于转座子中多聚腺苷酸位点的长度。

3‘端可变的TE转录,会导致转座子侧翼的序列随着转座一同被插入到新的位置,TE 5‘端侧翼出现的启动子也会产生导致这种现象,称之为5'|3' 的transduction

3.1短的TE转录本: 与全长的逆转录RNA相比,短的TE转录本可以通过提前的多聚腺苷酸化或者剪接产生。例如人类中L1转座子,可以通过剪接产生具有核酸内切酶和逆转录酶活性的ORF2p蛋白。

3.2TE内部包含完整的启动子:转座子自主转座的能力依赖于其包含有完整的启动子,然而逆转座子的5'端由于DNA修复机制的存在,经常发生截断。也有可能在逆转录的过程中对5'UTR的剪切而使得,转座子启动子的丧失;染色体的同源重组导致转座子启动子和编码区的分离。

3.3TE嵌合到基因中: 基因和TE的整合使得逆转座子的转录图谱更加复杂,导致在成熟的mRNA中包含TE的片段或者完整的TE序列。单个LTRs和L1启动子通常会驱动lncRNA的合成,同时与剪接事件结合导致嵌合转录本的产生。因此当检测到TE表达发生明显改变的时候,也有可能是TE所插入的基因表达量的变化。在人类中99%的L1-RNA是通过与基因共转录产生的,其所产生的RNA可能和lncRNA、enhancer-RNA产生有关。

3.4双链TE RNA: 可能会抑制基因的表达、沉默转座子的扩增。

4.测量转座子的表达

​ 对于TE的生物学的研究,通常包括TE中具有动员能力的部分是否已经表达,是否会导致新的插入的产生,是否对基因的功能有影响,以及是否会合成一些生物物质例如dsRNA、smallRNA或者TE蛋白。

4.1常规测定TE表达量的方法

​ 虽然测序技术快速发展,但是常规额分子生物途径能够提供全基因组测序所不能得到的信息。

使用RT-qPCR是常见的用于检测TE转录水平的方法,但仍旧还具有一定的局限性。

  • 提取的RNA中就包含mRNA、TE自主转录和被动转录的混合物。

  • 对TE设计引物比较困难

  • 扩增的片段序列信息是未知的,因为TE的多个拷贝之间可能存在突变和截断

报告基因的插入可以用于检测单个TE的表达

4.2检测TE蛋白质

转座子内部的突变,会导致TE不能翻译出正常功能的蛋白,从而限制了TE的移动。经常通过western bloting或者免疫荧光技术,来评估TE的蛋白质表达水平。但是存在潜在的交叉反应,由于TE在同一个家族内部是高度同源的。

全基因组水平分析TE的表达

由于很难针对TE设计短的特异性的探针,因此很难利用基因芯片来检测TE的表达水平。虽然有二代高通量测序技术的存在,但是还是不能够以基因表达的方式分析转录子的表达。在使用全基因组水平的计算工具时,要根据TE的多态性考虑到read比对的重复性情况,比对的位点是否是特异性的。

  • 能够区分自转录还是共转录

  • 发现和量化嵌合转录本

  • 分析由TE驱动的dsRNA、sRNA的表达水平

5.1比对

TE都是重复序列,同时在进化过程中TE家族成员之间高度相似,导致short read会比对到基因组的多个区域中。

简单的方法就是只保留uniq 比对的reads,然后对TE家族中的read汇总;

但这也只能估计一下old TE的表达水平;它会大大的消除一下young TE的信号;因此这种方法也只能检测到TE的存在而不能够衡量它的表达水平。

最好的解决办法就是增加测序read的长度。

例如使用双端测序read,当时使用100bp的单端测序时大约能比对到88%的TE区域,2x100这个比例会更高一些。

Previous多倍化NextHomoeolog expression bias and expression level dominance (ELD) in four tissues of natural allotetrap

Last updated 4 years ago

Was this helpful?