🎨
booknote
  • Zpliu'Booknote
  • ggplot2
    • 不继承原有数据
    • Untitled Folder 1
      • 直方图绘制
    • 02基于Github笔记实现
    • 回归分析
    • 饼图
    • Theme函数
    • 直方图
    • 分面
    • pheatmap
    • 折线图
    • 桑基图
    • GO富集分析图
    • jupyter内使用R
    • 维恩图
    • 自定义图例
    • ggridges 山峦图
    • GO气泡图
    • 散点图
    • 从数据框中计算频率
    • 箱型图
  • 前端操作
    • 实例练习
      • 动态搜索网页
        • 后端
          • Node 服务框架
          • primer数据表的增删改查
          • 前端post请求
          • login 验证
          • Vue模板
            • Vue-router前端渲染
            • main.vue
          • 基于cookie登录验证
          • 使用mysql包进行数据库的交互
          • 数据库表
            • 学生信息表
            • 用户登录表
            • mysql 事务
            • 教师表
            • 引物表
          • mysql服务
          • html模板页面
            • 错误模板页
          • 08文件上传与下载
        • 解决webpack打包后文件过大问题
        • 前端
          • vue
            • 基于element-ui框架
            • 06 个人主页
            • 08上传组件el-upload
            • element-ui
            • Vue 构建前端框架
            • login登录界面
            • 07表格多选
            • show-data页面
          • vue-cookie
          • vue-router
            • 路由组件传参
        • Appach代理服务转发node
      • pie-progress
        • 01
      • 登录界面
      • Untitled
    • JavaScript
      • fasta文件校验
      • codewar中的练习题
      • 6kyu
      • chapter03
        • 数据类型
      • tweenjs
    • css
      • CSS布局
      • 02定位
    • 前端使用ajax进行异步请求
    • gitbook
    • html
      • 03表格
      • Vue星空
    • Log for study
  • 可变剪切
    • 第六次分析
      • 设计引物
      • 多倍化过程中的变化3
      • 不同棉种间AS的差异
      • At与Dt中不存在保守转录本的基因
      • AS调控基因表达
      • 多倍化过程中变化2
      • 可变剪切统计
      • 可变剪切的进化分析
      • 保守AS模式的鉴定
      • 提纲
      • 可变剪切的翻译分析
      • 多倍化过程中isoform的变化
      • 表观遗传在AS中的作用
      • 全长转录本数据的统计
      • 表观遗传在AS中的作用2
    • 03表观遗传与可变剪切
    • 数据处理流程
      • 计算同源基因间AS的保守程度
      • 重新开始鉴定AS.md
      • 统计IR保守性比例
      • 基因分类
      • 20200111可变剪切数目统计
      • 完全保守的基因对
      • 20200315
      • 20200214
      • 第三个结果
      • 20191230对AS类型进行定义
      • AS保守程度的统计
      • 20200219合并IR
      • 20200320
      • IR事件保守的长度
      • 分析同源基因中发生IR事件的频率
      • 保守的IR的长度统计
      • 筛选基因用于GO富集分析
      • 2020102把没有发生剪切事件的位置找出来
      • 对剪切事件进行分类
      • 06比较不同棉种中isform的差异
      • 甲基化数据处理
      • 寻找motif
      • 根据IR的保守程度对基因进行GO富集分析
      • 分析同源基因间可变剪切的差异
      • 基于前面已经分好的类进行统计
      • 寻找同源基因对应的位点
      • 对同源基因的剪切事件进行分类.md
      • 分析染色体上各种特征
      • HIN1下游调控基因的分析
      • intron 分布
      • 20200102GO富集分析
      • 01全长转录组数据处理
      • 甲基化重复间的处理
    • 文献理解
      • 10核小体定位决定外显子识别
      • 22
      • 09梨树中两个亚基因组经历unbiased 进化
      • 11RNA介导的局部染色质修饰对可变剪切的调控
      • 19讨论染色质开放程度与IR的关系
      • 03植物中的表观遗传
      • 06甲基化在拟南芥开花过程中的研究
      • 20可变剪切的进化
      • 14干旱积累对HIN1蛋白剪切效率的影响
      • 18内含子保留事件中不断变化的范式和调控方式
      • 04从RNA-seq研究可变剪切
      • 16多种RNA-seq策略揭示棉花中高精度的转录态势
      • 07ChIp-seq测序原理 chromatin immunoprecipitation
      • 05甲基化测序数据比对原理
      • 13使用iso-seq分析高粱转录本数据
      • 15POWERDRESS与HDA9相互作用促进去乙酰化
      • 12通过转录与染色质结构的耦合调控可变剪切
      • 英语句子
      • paper list
      • 01多组学数据揭示表观遗传
      • 02A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulat
      • 17可变剪切与表观遗传导致白血病
      • 21smallRNA与DNA甲基化
    • 文章提纲
    • AS多倍化过程中的变化
    • 软件使用
      • 01三代测序Iso-seq
      • Bedtools
      • iso-seq测序2.0版本
      • 02Chip-seq操作流程
      • EMBOSS
      • 05鉴定duplicate gene
      • 07kobas本地进行注释
      • MEME本地化
      • DNA甲基化分析流程
      • stringtie
    • 第7个结果
    • 原始数据处理
      • 01三代测序数据原理
      • 02测序read数目统计
    • 第8个结果
    • 第五次分析
      • isoform水平分析
      • rmats2sashimiplot
      • 可变剪切的鉴定
      • 使用单个样本的数据进行AS分析
    • 表观遗传
    • 保守AS的鉴定
    • 第四次分析了
      • 甲基化计算
      • AS统计
      • 分析IR在各个基因组的保守性
    • 第三次对AS进行统计
      • 鉴定DRMs区域
      • 04
      • 重新下载原始数据进行比对
      • 02
      • 01
    • 第三个结果
    • 原始read的分类
    • 表观数据分析
    • 从RNA-seq研究可变剪切
  • 文献
    • 表观遗传
      • 植物中甲基化机制以及靶向操纵工具
    • 陈增建老师
      • 文章
    • 可变剪切
      • Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants
      • Variant phasing and haplotypic expression from long-read sequencing in maize
      • 02
      • 01
      • 可变剪接的研究进展及展望
      • 06
      • Co-expression networks reveal the tissue-specific regulation of transcription and splicing
    • panGenome
      • 番茄中广泛的结构变异对基因表达和性状改良中的作用
    • TWAS
      • TWAS解读
    • 数量遗传older
      • Reinventing quantitative genetics for plant breeding: something old, something new, something borrow
    • Untitled 1
    • 多倍化
      • Measuring and interpreting transposable element expression
      • Homoeolog expression bias and expression level dominance (ELD) in four tissues of natural allotetrap
    • 转录调控
      • 指导植物RNA聚合酶II转录的‘GPS’
      • 02综述
    • 3D基因组
      • Methods for mapping 3D chromosome architecture
      • 由粘连蛋白介导的人类基因组中染色体loop图谱
      • 经典Hi-C文献
      • 小麦染色质被组装成基因组疆域和转录工厂
      • Lamina-associated domains: peripheral matters and internal affairs
      • Three-dimensional chromatin landscapes in T cell acute lymphoblastic leukemia
      • Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer
      • Evolutionary dynamics of 3D genome architecture following polyploidization in cotton
      • On the existence and functionality of topologically associating domains
    • Untitled
    • GWAS
      • Population Genomic Analysis and De Novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary
  • CRISP Case9
    • sgRNA设计
    • 01编辑效率检测
    • Hi-TOM
    • 02检查单株覆盖度
  • python
    • matplotlib
      • 图片的基本设置
      • 韦恩图
      • 折线图
      • 堆积直方图
      • 散点图
      • imshow绘制热图
    • 爬虫
      • 根据关键字获取对应的基因
      • TE
    • 多进程
    • 基于模块化编程
    • pybedtools
      • 01API
    • 高级特性
      • 列表操作
      • pickle
    • SOS
      • Script of scripts (SOS)
    • python 解析命令行参数
    • 简单实现python多进程
    • gffutils
      • gffutils
    • 多线程读取文件
    • rpy2
      • 在jupyter中调用R代码
    • pandas
      • 取数据
    • pysam
      • 01API接口
  • cottonWeb
    • 初始化项目
    • views
      • login
      • 404页面
      • register页面
    • 后端
      • Hi-C
      • 错误代码合集
      • SequenceServer搭建网页服务
      • 手把手教你搭建JBrowse-初始化应用
      • 优化JBrowse
    • Vue中使用Echarts
    • 2配置axios请求
    • 07搜索框实时推荐
    • 动画效果
    • layout布局
    • mysql
      • 基因操作
    • 路由配置
  • Vue
    • vue-route
      • 路由
    • Vue中发起ajax请求
    • 计算属性和侦听器
    • provide inject
    • 列表渲染
    • 自定义指令
    • 事件处理
    • Vue项目
      • 九宫格实现
      • 使用vue-resource进行ajax请求
      • 在项目中使用v-router
      • 新闻页面
      • 项目迁移
      • 使用Mint UI组件库
    • 案例操作
      • 02基于Github笔记实现
      • 实现购物车功能
      • Vue组建化
      • todomvc实现日程安排
    • 页面组件化
    • Vue 实例化操作
    • vue
    • 动画的渲染
    • 模板语法
    • class & style
    • 13 动画和过渡效果
    • 02guide
    • 深入了解组件化
    • 表单输入绑定
    • 条件渲染v-if
    • vue-chartjs
      • 起步
  • 并行计算
    • 实验室考试
    • 计算圆周率PI
    • 04.forthClass
    • 使用python3中的threading模块进行简单的并行计算
    • test
      • lastTest
      • 111
    • 第三节课作业
    • 05 test
    • 04test
    • 05homework
    • 04homework
    • OpenMP
    • 集群结构
    • CPU核、多线程、多进程
    • 05Class
    • 06class
    • 07class
    • 08class
  • WebPack
    • 打包css文件
    • 基于Webpack进行Vue开发
    • 处理url 图片
    • webpack 打包Vue
    • 基于webpack的路由操作
    • webpack
  • VueCLI
    • 03组件批量注册
    • 04拖拽插件
    • 05axios跨域问题
    • 07时间轴
    • Blast+ 网页实现
    • VueCLI 安装
    • axios请求
  • Script
    • 转录因子结合位点预测
    • BinomTest
  • mysql
    • 常见函数
      • 常见函数
      • 函数
    • 查询
      • 排序查询
      • 联合查询
      • 基本查询语句
    • 字段约束条件
    • SQLyog
    • 修改
      • 修改
    • powerdesigner数据库模型设计
    • 插入
      • 插入数据
    • 事务
      • 事务
    • 添加新用户
    • 视图
      • 视图
  • 文本编辑器
    • vscode 连接数据库
    • Vue模板补齐
    • visual Studio Code
  • source_code
    • Untitled
    • 并行计算
      • 04test
    • 公众号
      • RNA-seq
    • Untitled 1
  • GWAS
    • QQ-plot
  • RNA-seq
    • 01AnalysisFlow
    • 02脚本批量提交
    • 差异表达基因
    • 文献
      • 01SPL1赋予植物热忍受能力
    • 02 建库方式
  • Linux
    • LSF
    • 02诺和致源下载数据
    • 配置阿里yum源
    • linux三剑客
    • 云梯
    • 取文件相同列
    • root基本命令
    • 服务器网站数据搬迁
    • shell脚本激活Conda环境
    • 使用vscode与服务端R交互
    • 如何使用Conda
    • vim常见使用方法
    • oh-my-zsh
    • bash中的字典与数组
  • SNP分子标记
    • vcf文件处理
  • 生信软件
    • samtools
    • bedtools
    • annovar注释SNP
    • HiC-Pro安装
    • Untitled
    • bwa使用
  • Hi-C
    • 软件
      • HiCPlotter安装
      • pre程序
    • 20200102计算共线性区间保守的boundary
    • 20200108保守的TAD
    • PanGenome
      • PanGenome与各个元件进行注释
      • Pan-Genome数据比对
      • 鉴定两个基因组之间重排
  • node
    • mysql
      • 使用Promise封装
      • 基本的SQL语句
      • mysql的增删改查
      • 在node中使用mysql
    • session与cookie保留用户登录状态
    • MongoDB
      • MongoDB中的SQL语句
      • MongoDB 数据库
      • mongoose中一些常用的查询语句
      • :pig_nose: node中使用MongoDB的实例
      • MongoDB关联查询
      • 设计数据模型
    • 保持数据库处于连接状态
    • npm
    • node中路由设计
    • express中中间件的概念
    • art-template模块的用法
    • curd增删改查的使用
    • Promise 异步编程
    • 关于express框架的学习
    • express-session
    • 配置log4js
  • Cell-Ranger
    • count输出文件夹
      • ANALYSIS
      • feature_bc_matrix文件夹
      • Analysis 结果
      • BARcoded BAM
    • CellRanger aggr
    • 10X genomics测序中用到的术语
    • single sample Analysis
    • Cell Ranger count使用手册
  • HOX3
    • 03共表达分析
    • 01RNA-seq
    • 02基因差异表达分析
  • vue-admin
    • 项目目录结构
  • R
    • dplyr
      • dpylr
      • 过滤数据框
  • 系统遗传学
    • 翻译综述
    • 从脊椎动物的视角解析衰老的遗传机制
    • 01
  • eQTL
    • PEER
      • PEER方法
      • 软件使用
    • 群体结构
      • bcftools
  • sQTL
    • HISAT2比对
    • 02数据处理
  • 资源
    • hexo服务搭建
    • 转录因子数据库
    • 前端资源
    • 01 优雅的PPT设计
    • 文章书写规范
  • SVG
    • 01起步
  • 王悦瑾
    • Bash练习题
    • Bash脚本
    • 9_28起步
  • ES6
    • 模板字符串
    • promise源码解析
    • 01
  • scRNAseq
    • 干细胞不对称分裂
      • Root stem cell niche organizer specification by molecular convergence of PLETHORA and SCARECROW tran
    • 茉莉酸代谢
    • 老年痴呆
  • 多倍体进化
    • 棉花进化
    • 棉属A基因组的起源与进化
  • Vuex
    • 解构前端登录请求
    • VueX
  • ElementUI
    • 源码学习
      • 01drawer
    • Element UI:rocket:
  • reference周记
    • 第一期
    • test
  • 苏柃
    • Bash练习
Powered by GitBook
On this page
  • 表观遗传调控基因的转录
  • 分析DMCs(差异的甲基化位点)
  • 分析同源基因中存在AS的基因对于不存在AS的基因间Methylation水平的差异

Was this helpful?

  1. 可变剪切
  2. 第六次分析

表观遗传在AS中的作用

表观遗传调控基因的转录

1.全基因组甲基化水平的展示

##合并两个重复的甲基化数据
cat Rep1_window_CHG.txt Rep2_window_CHG.txt |awk '{a[$1"-"$2"-"$3]+=$4/($4+$5)}END{for(i in a){print i"\t"a[i]/2}}'|sed 's/-/\t/g' >A2_Rep1_Rep2_window_CHG.bed
##转化成四倍体的坐标
##将bed文件转换为bam文件,建索引方便查找

1.IR、intron在CG甲基化上的差异

计算的是相对甲基化程度: 被测到的C中,甲基化的c占所有测到的C的比例。

  • 过滤掉那些没有CG碱基的片段

  • CG甲基化是对称的,因此在正负两条链上的C都是被甲基化的,就是相邻位置C碱基都被检测到甲基化

##计算相对甲基化
甲基化的C/检测到的C
python /public/home/zpliu/work/Alternative/result/Gh_result/CO31_32_result/15methylation/methylation/caculateCpGmethylation.py
##计算平均甲基化程度
for file in constitutive_exon constitutive_intron IR SE; do
  for i in CpG CHH CHG; do
    lines=$(wc -l ../${file}.bed | awk '{print $1}')
    awk '{a+=$2/($2+$3)}END{print "'${file}''${i}'""\t"a/"'$lines'"}' ${file}_${i}.txt
  done
done

较长的exon的CpG甲基化程度更低??

多倍化后,甲基化的程度也更高了;甲基转移酶效率变高了导致剪接效率降低?测序深度更高?亚组间序列高度重复导致重复比对的read数

基因组

exon/SE均值

intron/IR 均值

exon检验

IR检验

TM-1

0.328/0.330

0.291/0.361

0.1712

2.2e-16

A2

0.188/0.170

0.165/0.179

0.0001347

5.027e-14

D5

0.247/0.243

0.224/0.274

0.0040

2.2e-16

2. 全基因组的甲基化水平的展示

将三个基因组放在同一个circos里,首先要做的就是确定谁和谁是同源染色体关系,在进行等比例的缩放

确定同源染色体关系,通过判断染色体上同源基因的数目、共线性关系;需要注意整条染色体倒位的现象,在进行染色体normal的时候需要进行调整

##计算每个window的甲基化程度
sed -e 's/>//' -e 's/:/\t/' -e 's/-/\t/' A2_window_CHG.txt |awk '{OFS="\t";print $1,$2+1,$3,$4/$5}'|sort -k1,1 -k2,3n >A2_window_CHG.bed
##根据同源染色体关系修改坐标
python ../../scale_diploid_polyploidy.py -a ../../A2/chromosome.bed  -b ../../A2/intersect/A2_window_CpG.bed  -o A2_window_CpG.bed

3.进化过程中基因转录本发生变化的同源基因,甲基化水平是否存在差异

  • DMGs和DSS,同一个基因组中转录本变化比较丰富的基因,它的甲基化程度与进化过程中保守的基因相比。

  • 保守AS和不保守AS,在CpG甲基化水平的差异

    The maize methylome influences mRNA splice sites and reveals widespread paramutation-like switches guided by small RNA

1.根据基因的分类,获取对应的甲基化水平

gene的分类是依据同源基因中,转录本的保守情况来分的;

  • 完全保守的基因

  • 半保守基因

  • 差异基因

##获取每个基因覆盖的C中甲基化的C
awk '{if($NF<=0.09&&$7>=3){a[$1":"$2"-"$3][1]+=1;a[$1":"$2"-"$3][2]+=0}else if($NF>0.05){a[$1":"$2"-"$3][1]+=0;a[$1":"$2"-"$3][2]+=1}else{}a[$1":"$2"-"$3][1]+=0;a[$1":"$2"-"$3][2]+=0}END{for(i in a){print ">"i"\t"a[i][1]"\t"a[i][1]+a[i][2]}}' A2_Rep1_CpG.txt >11
##获取每种分类的平均甲基化程度
python /public/home/zpliu/work/Alternative/result/Gh_result/CO31_32_result/15methylation/evolutionMethylation/methylation_bygeneCategory.py ../../evolution4/A2_vs_AT/geneFPKM_isoformCount.txt  ~/work/Alternative/result/homologo/homologGene/A2_gene.gff  A2_gene_CpG.txt 11
##统计每类gene的平均甲基化水平,
grep mild A2_gene_category_CpG.txt |awk '{a+=$2}END{print a/NR}'

2.保守的AS事件与不保守的AS事件在甲基化上的差异

  • 两个基因组保守的剪接事件间AS的差异

  • 一个基因组发生AS的丢失、或者是新的AS的产生

这里的AS就都只考虑IR和SE事件

A2中的IR在使用K-mer去与Atexon取交集后,大部分都被固定成intron了;这就导致了At中为啥CpG水平会更高了。

At中特有的IR去与A2的exon取交集,发现At中特有的IR都由 constitutive intron转变过来的。

为什么IR会向exon转变或者exon为什么会向IR转变。

看看 uniq IR向intron、或者intron向 uniq IR转变的例子。

  • 进化过程中大部分都是IR和intron之间的转化

  • 进化过程中IR向intron转化类型,甲基化程度的变化

把IR在多倍化后转变的状态分成两类:

  • 多倍化后保持intron的状态

  • 多倍化后保持exon的状态

A2中特异性的IR事件在At中处于intron的状态,也有转变为exon状态的;统计这些两种转变状态比例和平均甲基化水平。

从相同的k-mer序列中提取保守的C位点

分析保守C胞嘧啶的甲基化差异。

A2中uniq的IR在多倍化后转化成哪种类型,At中uniq的IR主要由哪种元件转化而来。

为了避免由于测序深度和序列变异导致在不同基因组比较时产生的误差,只比较保守的C位点的甲基化程度差异。

保守C位点在IR与intron间的甲基化程度差异,统计每个片段保守的C差异达到0.5以上的占片段中保守C的比例。

  • A2中exon转变为At中的intron在甲基化水平上没有差异

  • A2中的intron转变为A2中的intron后

  • 甲基化水平明显上升了

在对多倍化过程中变化的片段分类后,比较片段之间保守C位点的甲基化程度差异,有多少片段的C是完全保守的,有多少片段的C变多了。

  • 甲基化程度的改变导致剪接机制的改变

  • 序列水平的变异导致剪接机制的改变

##提取片段之间保守的胞嘧啶


##获取IR多倍化后转变为intron的例子
awk '$5!="."&&($3-$6)/($3-$2)>0.95||($2>=$6&&$3<=$7){print $0}' 四倍体kmer坐标与四倍体constitutive,intron交集 |cut -f1-3 |sort -k1,1 -k2,3n|uniq >A2_At_IR2intron
## 获取IR多倍化后转变为exon的例子
 cat A2_At_IR2intron A2_uniq_IR_At.bed |sort -k1,1 -k2,3n|uniq -u|wc -l

##计算某一个区域的甲基化水平
awk '{if($8>3&&$11<=0.05){a[$4][1]+=1;a[$4][2]+=0}else{a[$4][1]+=0;a[$4][2]+=1}}END{for(i in a){print i"\t"a[i][1]/(a[i][1]+a[i][2])}}' A2tmp

##多倍化过程中丢失的IR和SE事件
cut -f1 A2_At_conserve_SE.txt |sort |uniq |awk '{print $1"\tNone"}'|cat - A2_AS_At_kmer.txt |awk '{print $2"\t"$1}'|sort -k2,2|uniq -f1 -u|grep  SE|awk '{print $2"\t"$1}' >A2_uniq_SE.txt
##多倍化过程中新获得的IR和SE事件

##多倍化过程中保守的IR事件

##保守与不保守的AS在intron附近甲基化程度的差异
python AS_flankCoordinateBed.py -i AS_bed/A2_uniq_IR.txt  -a diploidRI -o A2_uniq_IR.bed
##提取对应的坐标作为bed文件
awk '$1~/Chr/{print $0}' ../01AS_bed/A2_uniq_IR.bed >02methylation_interactive/A2.bed
awk '$1~/Ghir/{print $0}' ../01AS_bed/A2_uniq_IR.bed >02methylation_interactive/At.bed
##与全基因组甲基化水平取交集
~/software/bedtools2-2.29.0/bin/intersectBed  -loj -a A2.bed  -b /data/cotton/zhenpingliu/QingxinSong_GB_DNAmethlation/A2/Rep1/02deduplicate_methylation/CpG_fdr.bed  >A2_CpG_intersect.out

## 计算所有覆盖到的平均甲基化程度
grep alloploidUniqIR At_Rep1_CpG.txt |awk '$2==$8{print $0}'|awk '{if($13<=0.05){a[$4][1]+=1;a[$4][2]+=1}else{a[$4][2]+=1}}END{for(i in a){print i"\t"a[i][1]/a[i][2]}}'|sort -k1,1n >1
##计算所覆盖到的每个胞嘧啶的平均甲基化程度(甲基化read/总read)


alloploidUniqIR
alloploidUniqSE
conservedIR
conservedSE
diploidRI
diploidUniqSE

计算DmCs Differentially methylated cytosines

##统计read总数
A2 203036174
At 819485163
##提取IR附近的碱基序列
awk '$1~/^>/{printf $0"\t"}$1~/^[^>]/{print $0}' A2_AS.fasta|awk '{split($1,a,"::");print a[2]"\t"a[1]"\t"$2}'|sed -e 's/:/\t/' -e 's/-/\t/' >11

##提取两个基因组中位置相同处,并且序列一致的bed文件
awk '$1~/^>/{printf $0"\t"}$1~/^[^>]/{print $0}' At_AS.fasta|awk '{split($1,a,"::");print a[2]"\t"a[1]"\t"$2}'|sed -e 's/:/\t/' -e 's/-/\t/' |cat - 11 |awk '$1~/Ghir/{a[$4][1]=$5;a[$4][2]=$1"-"$2"-"$3;}$1~/Chr/{a[$4][3]=$5;a[$4][4]=$1"-"$2"-"$3;}END{for(i in a){if(a[i][1]==a[i][3]){print a[i][2]"\t"a[i][4]"\t"a[i][1]"\t"i}}}' >22

不同剪切事件在表观上的差异

IR事件的CpG甲基化,比intron的CpG甲基化程度要高

在C上的甲基化差异程度

有的剪接事件即使序列水平上存在很大差异,但仍旧存在AS事件;而有的即使序列很保守;但却不存在保守的AS事件。

不同类型的剪接事件在DNA甲基化上的差异。

这个事件得过滤一下,有些特异性的事件PSI值很小。

筛选标准:PIR值

  • 分析两个坐标间序列的相似程度

  • DNA甲基化程度 差异

分析多倍化过程中保守的C嘧啶的甲基化程度是否存在差异

##获取事件的BED坐标
python ~/github/zpliuCode/Isoseq3/04ASconserved/extractAScoordinate.py 
##分染色体跑
python ~/github/zpliuCode/Isoseq3/07methylation/singleCytosinsMethylation.py  甲基化染色体文件目录 剪接事件坐标文件 输出文件前缀
##每个区域胞嘧啶的甲基化程度
cat Chr*|awk '$9>=3{a[$4][1]+=1}$9=="."{a[$4][1]+=0;a[$4][2]+=0}$9!="."{a[$4][1]+=0;a[$4][2]+=1}END{for(i in a){print i"\t"a[i][1]"\t"a[i][2]}}' |awk '$3==0{print $0}'   >最终文件

分析DMCs(差异的甲基化位点)

过滤掉相似度低于90%的k-mer,获取对应的DMRs和DMCs位点。

多倍化过程中:保守的胞嘧啶位点位点甲基化程度

保守的RI、SE区域

不保守的RI、SE区域

得到保守的胞嘧啶位置:

  • 保守的区域中的保守胞嘧啶位点

  • 左右各50bp的read

##筛选两个基因组间保守k-mer长度不超过10bp的的区域
awk 'sqrt(($3-$4)*($3-$4))<=10{print $0}' ../A2RI2intron.txt >A2RI2intron_filter.txt 
##得到RI2intron的fasta序列
python ~/github/zpliuCode/Isoseq3/04ASconserved/extractAScoordinate.py
##得到保守的胞嘧啶位点
python ~/github/zpliuCode/Isoseq3/07methylation/conservedSytosins.py 保守的剪接事件对应的文件  剪接事件的fasta文件 ~/software/muscle3.8.31_i86linux64 单核苷酸的保守信息
##统计保守的C和保守的G的碱基数
 awk '$1==$2&&$1=="C"{print $3"\t"$4}' D5_Dt_nucle.txt| |wc -l

计算保守胞嘧啶的甲基化程度

##得到每个碱基事件中,保守C的甲基化数据
python ~/github/zpliuCode/Isoseq3/07methylation/singleCytosinsMethylation.py 基因组1的甲基化文件 基因组2的甲基化数据 保守的单核苷酸文件 输出文件
 awk '$3!="None"&&$6!="None"{print $0}' 44 |awk '{a+=$3/($3+$4);b+=$5/($6+$5)}END{print a/NR"\t"b/NR}'

多倍化过程中保守的C占区段内总的胞嘧啶的比例:

A2 vs At:

RI to intron: 190910*2/385580

intron to RI : 110834*2/224118

D5 vs Dt

RI to intron:151016*2/306620

intron to RI : 99436*2/202027

多倍化过程中AS的变化影响因素有多种可能:

  • exon相比于intron有更高的CG甲基化

  • 序列水平的差异导致的AS变化,序列水平不一致的时候,甲基化影响AS的程度

  • 序列完全一致的情况下,既有正影响,也有负影响

AS事件的序列完全保守,比较甲基化的差异

##计算两个片段序列的相似程度
python ~/github/zpliuCode/Isoseq3/07methylation/sequenceConservedRation.py  D5RI2intron.txt D5_Dt.fa  ~/software/muscle3.8.31_i86linux64 sequenceIdentity.txt 
##筛选序列完全一致的序列,平均甲基化程度是否存在差异。
awk '$NF==$(NF-1)&&$(NF-1)==$(NF-2){print $0}'  sequenceIdentity.txt |wc -l
##统计两个棉种中同源片段的甲基化程度
~/software/bedtools2-2.29.0/bin/intersectBed  -a D5.bed  -loj -b /data/cotton/zhenpingliu/QingxinSong_GB_DNAmethlation/D5/Rep1/02deduplicate_methylation/CpG_fdr.bed >D5_intersect.txt
##计算区域的甲基化程度
awk '$11=="."{a[$4][1]=0;a[$4][2]=1}$11<=0.05&&$11!="."{a[$4][1]+=1;}$11>0.05{a[$4][2]+=1}END{for(i in a){print i"\t"a[i][1]/(a[i][1]+a[i][2])}}' D5_intersect.txt|less

太多一对多的坐标了,把RI事件统一获取最保守的事件坐标和PRI值

##获取最保守的事件坐标
python ~/github/zpliuCode/Isoseq3/07methylation/filterRIeventcoordinate.py D5_Dt.txt D5_RI_Dt_RI.txt
##根据事件的长度的绝对差值再筛选一遍
awk 'sqrt(($3-$4)*($3-$4))<50{print $0}' D5RI2intron.txt |less

分析同源基因中存在AS的基因对于不存在AS的基因间Methylation水平的差异

Previous多倍化过程中isoform的变化Next全长转录本数据的统计

Last updated 4 years ago

Was this helpful?

同源染色体对应关系