🎨
booknote
  • Zpliu'Booknote
  • ggplot2
    • 不继承原有数据
    • Untitled Folder 1
      • 直方图绘制
    • 02基于Github笔记实现
    • 回归分析
    • 饼图
    • Theme函数
    • 直方图
    • 分面
    • pheatmap
    • 折线图
    • 桑基图
    • GO富集分析图
    • jupyter内使用R
    • 维恩图
    • 自定义图例
    • ggridges 山峦图
    • GO气泡图
    • 散点图
    • 从数据框中计算频率
    • 箱型图
  • 前端操作
    • 实例练习
      • 动态搜索网页
        • 后端
          • Node 服务框架
          • primer数据表的增删改查
          • 前端post请求
          • login 验证
          • Vue模板
            • Vue-router前端渲染
            • main.vue
          • 基于cookie登录验证
          • 使用mysql包进行数据库的交互
          • 数据库表
            • 学生信息表
            • 用户登录表
            • mysql 事务
            • 教师表
            • 引物表
          • mysql服务
          • html模板页面
            • 错误模板页
          • 08文件上传与下载
        • 解决webpack打包后文件过大问题
        • 前端
          • vue
            • 基于element-ui框架
            • 06 个人主页
            • 08上传组件el-upload
            • element-ui
            • Vue 构建前端框架
            • login登录界面
            • 07表格多选
            • show-data页面
          • vue-cookie
          • vue-router
            • 路由组件传参
        • Appach代理服务转发node
      • pie-progress
        • 01
      • 登录界面
      • Untitled
    • JavaScript
      • fasta文件校验
      • codewar中的练习题
      • 6kyu
      • chapter03
        • 数据类型
      • tweenjs
    • css
      • CSS布局
      • 02定位
    • 前端使用ajax进行异步请求
    • gitbook
    • html
      • 03表格
      • Vue星空
    • Log for study
  • 可变剪切
    • 第六次分析
      • 设计引物
      • 多倍化过程中的变化3
      • 不同棉种间AS的差异
      • At与Dt中不存在保守转录本的基因
      • AS调控基因表达
      • 多倍化过程中变化2
      • 可变剪切统计
      • 可变剪切的进化分析
      • 保守AS模式的鉴定
      • 提纲
      • 可变剪切的翻译分析
      • 多倍化过程中isoform的变化
      • 表观遗传在AS中的作用
      • 全长转录本数据的统计
      • 表观遗传在AS中的作用2
    • 03表观遗传与可变剪切
    • 数据处理流程
      • 计算同源基因间AS的保守程度
      • 重新开始鉴定AS.md
      • 统计IR保守性比例
      • 基因分类
      • 20200111可变剪切数目统计
      • 完全保守的基因对
      • 20200315
      • 20200214
      • 第三个结果
      • 20191230对AS类型进行定义
      • AS保守程度的统计
      • 20200219合并IR
      • 20200320
      • IR事件保守的长度
      • 分析同源基因中发生IR事件的频率
      • 保守的IR的长度统计
      • 筛选基因用于GO富集分析
      • 2020102把没有发生剪切事件的位置找出来
      • 对剪切事件进行分类
      • 06比较不同棉种中isform的差异
      • 甲基化数据处理
      • 寻找motif
      • 根据IR的保守程度对基因进行GO富集分析
      • 分析同源基因间可变剪切的差异
      • 基于前面已经分好的类进行统计
      • 寻找同源基因对应的位点
      • 对同源基因的剪切事件进行分类.md
      • 分析染色体上各种特征
      • HIN1下游调控基因的分析
      • intron 分布
      • 20200102GO富集分析
      • 01全长转录组数据处理
      • 甲基化重复间的处理
    • 文献理解
      • 10核小体定位决定外显子识别
      • 22
      • 09梨树中两个亚基因组经历unbiased 进化
      • 11RNA介导的局部染色质修饰对可变剪切的调控
      • 19讨论染色质开放程度与IR的关系
      • 03植物中的表观遗传
      • 06甲基化在拟南芥开花过程中的研究
      • 20可变剪切的进化
      • 14干旱积累对HIN1蛋白剪切效率的影响
      • 18内含子保留事件中不断变化的范式和调控方式
      • 04从RNA-seq研究可变剪切
      • 16多种RNA-seq策略揭示棉花中高精度的转录态势
      • 07ChIp-seq测序原理 chromatin immunoprecipitation
      • 05甲基化测序数据比对原理
      • 13使用iso-seq分析高粱转录本数据
      • 15POWERDRESS与HDA9相互作用促进去乙酰化
      • 12通过转录与染色质结构的耦合调控可变剪切
      • 英语句子
      • paper list
      • 01多组学数据揭示表观遗传
      • 02A global survey of alternative splicing in allopolyploid cotton: landscape, complexity and regulat
      • 17可变剪切与表观遗传导致白血病
      • 21smallRNA与DNA甲基化
    • 文章提纲
    • AS多倍化过程中的变化
    • 软件使用
      • 01三代测序Iso-seq
      • Bedtools
      • iso-seq测序2.0版本
      • 02Chip-seq操作流程
      • EMBOSS
      • 05鉴定duplicate gene
      • 07kobas本地进行注释
      • MEME本地化
      • DNA甲基化分析流程
      • stringtie
    • 第7个结果
    • 原始数据处理
      • 01三代测序数据原理
      • 02测序read数目统计
    • 第8个结果
    • 第五次分析
      • isoform水平分析
      • rmats2sashimiplot
      • 可变剪切的鉴定
      • 使用单个样本的数据进行AS分析
    • 表观遗传
    • 保守AS的鉴定
    • 第四次分析了
      • 甲基化计算
      • AS统计
      • 分析IR在各个基因组的保守性
    • 第三次对AS进行统计
      • 鉴定DRMs区域
      • 04
      • 重新下载原始数据进行比对
      • 02
      • 01
    • 第三个结果
    • 原始read的分类
    • 表观数据分析
    • 从RNA-seq研究可变剪切
  • 文献
    • 表观遗传
      • 植物中甲基化机制以及靶向操纵工具
    • 陈增建老师
      • 文章
    • 可变剪切
      • Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants
      • Variant phasing and haplotypic expression from long-read sequencing in maize
      • 02
      • 01
      • 可变剪接的研究进展及展望
      • 06
      • Co-expression networks reveal the tissue-specific regulation of transcription and splicing
    • panGenome
      • 番茄中广泛的结构变异对基因表达和性状改良中的作用
    • TWAS
      • TWAS解读
    • 数量遗传older
      • Reinventing quantitative genetics for plant breeding: something old, something new, something borrow
    • Untitled 1
    • 多倍化
      • Measuring and interpreting transposable element expression
      • Homoeolog expression bias and expression level dominance (ELD) in four tissues of natural allotetrap
    • 转录调控
      • 指导植物RNA聚合酶II转录的‘GPS’
      • 02综述
    • 3D基因组
      • Methods for mapping 3D chromosome architecture
      • 由粘连蛋白介导的人类基因组中染色体loop图谱
      • 经典Hi-C文献
      • 小麦染色质被组装成基因组疆域和转录工厂
      • Lamina-associated domains: peripheral matters and internal affairs
      • Three-dimensional chromatin landscapes in T cell acute lymphoblastic leukemia
      • Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer
      • Evolutionary dynamics of 3D genome architecture following polyploidization in cotton
      • On the existence and functionality of topologically associating domains
    • Untitled
    • GWAS
      • Population Genomic Analysis and De Novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary
  • CRISP Case9
    • sgRNA设计
    • 01编辑效率检测
    • Hi-TOM
    • 02检查单株覆盖度
  • python
    • matplotlib
      • 图片的基本设置
      • 韦恩图
      • 折线图
      • 堆积直方图
      • 散点图
      • imshow绘制热图
    • 爬虫
      • 根据关键字获取对应的基因
      • TE
    • 多进程
    • 基于模块化编程
    • pybedtools
      • 01API
    • 高级特性
      • 列表操作
      • pickle
    • SOS
      • Script of scripts (SOS)
    • python 解析命令行参数
    • 简单实现python多进程
    • gffutils
      • gffutils
    • 多线程读取文件
    • rpy2
      • 在jupyter中调用R代码
    • pandas
      • 取数据
    • pysam
      • 01API接口
  • cottonWeb
    • 初始化项目
    • views
      • login
      • 404页面
      • register页面
    • 后端
      • Hi-C
      • 错误代码合集
      • SequenceServer搭建网页服务
      • 手把手教你搭建JBrowse-初始化应用
      • 优化JBrowse
    • Vue中使用Echarts
    • 2配置axios请求
    • 07搜索框实时推荐
    • 动画效果
    • layout布局
    • mysql
      • 基因操作
    • 路由配置
  • Vue
    • vue-route
      • 路由
    • Vue中发起ajax请求
    • 计算属性和侦听器
    • provide inject
    • 列表渲染
    • 自定义指令
    • 事件处理
    • Vue项目
      • 九宫格实现
      • 使用vue-resource进行ajax请求
      • 在项目中使用v-router
      • 新闻页面
      • 项目迁移
      • 使用Mint UI组件库
    • 案例操作
      • 02基于Github笔记实现
      • 实现购物车功能
      • Vue组建化
      • todomvc实现日程安排
    • 页面组件化
    • Vue 实例化操作
    • vue
    • 动画的渲染
    • 模板语法
    • class & style
    • 13 动画和过渡效果
    • 02guide
    • 深入了解组件化
    • 表单输入绑定
    • 条件渲染v-if
    • vue-chartjs
      • 起步
  • 并行计算
    • 实验室考试
    • 计算圆周率PI
    • 04.forthClass
    • 使用python3中的threading模块进行简单的并行计算
    • test
      • lastTest
      • 111
    • 第三节课作业
    • 05 test
    • 04test
    • 05homework
    • 04homework
    • OpenMP
    • 集群结构
    • CPU核、多线程、多进程
    • 05Class
    • 06class
    • 07class
    • 08class
  • WebPack
    • 打包css文件
    • 基于Webpack进行Vue开发
    • 处理url 图片
    • webpack 打包Vue
    • 基于webpack的路由操作
    • webpack
  • VueCLI
    • 03组件批量注册
    • 04拖拽插件
    • 05axios跨域问题
    • 07时间轴
    • Blast+ 网页实现
    • VueCLI 安装
    • axios请求
  • Script
    • 转录因子结合位点预测
    • BinomTest
  • mysql
    • 常见函数
      • 常见函数
      • 函数
    • 查询
      • 排序查询
      • 联合查询
      • 基本查询语句
    • 字段约束条件
    • SQLyog
    • 修改
      • 修改
    • powerdesigner数据库模型设计
    • 插入
      • 插入数据
    • 事务
      • 事务
    • 添加新用户
    • 视图
      • 视图
  • 文本编辑器
    • vscode 连接数据库
    • Vue模板补齐
    • visual Studio Code
  • source_code
    • Untitled
    • 并行计算
      • 04test
    • 公众号
      • RNA-seq
    • Untitled 1
  • GWAS
    • QQ-plot
  • RNA-seq
    • 01AnalysisFlow
    • 02脚本批量提交
    • 差异表达基因
    • 文献
      • 01SPL1赋予植物热忍受能力
    • 02 建库方式
  • Linux
    • LSF
    • 02诺和致源下载数据
    • 配置阿里yum源
    • linux三剑客
    • 云梯
    • 取文件相同列
    • root基本命令
    • 服务器网站数据搬迁
    • shell脚本激活Conda环境
    • 使用vscode与服务端R交互
    • 如何使用Conda
    • vim常见使用方法
    • oh-my-zsh
    • bash中的字典与数组
  • SNP分子标记
    • vcf文件处理
  • 生信软件
    • samtools
    • bedtools
    • annovar注释SNP
    • HiC-Pro安装
    • Untitled
    • bwa使用
  • Hi-C
    • 软件
      • HiCPlotter安装
      • pre程序
    • 20200102计算共线性区间保守的boundary
    • 20200108保守的TAD
    • PanGenome
      • PanGenome与各个元件进行注释
      • Pan-Genome数据比对
      • 鉴定两个基因组之间重排
  • node
    • mysql
      • 使用Promise封装
      • 基本的SQL语句
      • mysql的增删改查
      • 在node中使用mysql
    • session与cookie保留用户登录状态
    • MongoDB
      • MongoDB中的SQL语句
      • MongoDB 数据库
      • mongoose中一些常用的查询语句
      • :pig_nose: node中使用MongoDB的实例
      • MongoDB关联查询
      • 设计数据模型
    • 保持数据库处于连接状态
    • npm
    • node中路由设计
    • express中中间件的概念
    • art-template模块的用法
    • curd增删改查的使用
    • Promise 异步编程
    • 关于express框架的学习
    • express-session
    • 配置log4js
  • Cell-Ranger
    • count输出文件夹
      • ANALYSIS
      • feature_bc_matrix文件夹
      • Analysis 结果
      • BARcoded BAM
    • CellRanger aggr
    • 10X genomics测序中用到的术语
    • single sample Analysis
    • Cell Ranger count使用手册
  • HOX3
    • 03共表达分析
    • 01RNA-seq
    • 02基因差异表达分析
  • vue-admin
    • 项目目录结构
  • R
    • dplyr
      • dpylr
      • 过滤数据框
  • 系统遗传学
    • 翻译综述
    • 从脊椎动物的视角解析衰老的遗传机制
    • 01
  • eQTL
    • PEER
      • PEER方法
      • 软件使用
    • 群体结构
      • bcftools
  • sQTL
    • HISAT2比对
    • 02数据处理
  • 资源
    • hexo服务搭建
    • 转录因子数据库
    • 前端资源
    • 01 优雅的PPT设计
    • 文章书写规范
  • SVG
    • 01起步
  • 王悦瑾
    • Bash练习题
    • Bash脚本
    • 9_28起步
  • ES6
    • 模板字符串
    • promise源码解析
    • 01
  • scRNAseq
    • 干细胞不对称分裂
      • Root stem cell niche organizer specification by molecular convergence of PLETHORA and SCARECROW tran
    • 茉莉酸代谢
    • 老年痴呆
  • 多倍体进化
    • 棉花进化
    • 棉属A基因组的起源与进化
  • Vuex
    • 解构前端登录请求
    • VueX
  • ElementUI
    • 源码学习
      • 01drawer
    • Element UI:rocket:
  • reference周记
    • 第一期
    • test
  • 苏柃
    • Bash练习
Powered by GitBook
On this page
  • Abstract
  • introduction
  • 数量遗传学的起源和基础
  • 为什么要在植物育种中重新定义数量遗传学
  • 育种工作者对数量遗传的期望发生了改变
  • 在植物育种中数量遗传的假设不满足
  • 新的计算工具的产生
  • Something old, something new, something borrowed, something BLUE
  • Old: multiple loci plus environmental effect
  • Old: identify candidates with the best genotypic value
  • Old: continue finding major QTL
  • New: no need for a reference population in Hardy–Weinberg equilibrium
  • BLUE: mixed-model analysis

Was this helpful?

  1. 文献
  2. 数量遗传older

Reinventing quantitative genetics for plant breeding: something old, something new, something borrow

Abstract

对遗传进行量化的目标随着应用的领域不同而不同。在植物育种中,对数量遗传主要关注于,在不同环境的目标群体中找到最佳的候选基因型。数量遗传学不断发展过程中,一些之前提出的观点仍旧非常有用,一些过时的观点被摈弃;同时需要引入一些新的概念和技术来支持现代育种。而其中的核心概念:性状受到,多个孟德尔基因座调控;仍旧没有发生改变。由于现在的育种工作中利用到的种质资源也不是处于Hardy–Weinberg 平衡状态,例如假定群体内部是随机交配的,仍旧会存在等位基因的平均效应和加性效应,这些因素都会影响植物育种。通过结合分子标记,以最小遗传假设的混合模型,实现最佳的线性无偏估计和预测。植物育种也将会从其他学科中借鉴方法而受益。例如实现对遗传效应和非遗传效应的准确测量,实现设计育种的模拟。这种针对遗传的模拟不是一成不变的,而是针对实际育种过程中的种质亲缘关系矩阵、分子标记数据、表型数据有所变化。这些年来植物育种中数量遗传的研究越来越偏向于计算、经验,而更少的进行理论上的研究。随着育种中可用的数据类型和数据量的增加,这种趋势将继续下去。

introduction

在最近的100中,数量遗传和植物育种的结合,有着明显的成效。在许多植物中对遗传变异和遗传力的估计进一步加强了对一些重要性状如:产量、质量和适应性的理解。原则上,数量遗传是被用来设计和不断完善,针对连续型性状的育种方法。对QTLs的研究,有利于作物的改良,同时进一步阐明了数量变异的原理。

尽管如此,随着过去几十年中植物育种和数量遗传学的发展,我们更应该停下来思考数量遗传如何能够更好的应用到当代育种中。本文的目的也是提供一个反思和探讨的框架和在当代育种背景下重新定义数量遗传并进行辩论。当然本文所提出来的一些想法可能不适用于其他领域例如人类遗传学,但是在这些领域中也可能起到一定的作用。

数量遗传学的起源和基础

植物育种工作者有时候会认为,数量遗传学就是为了进一步增强植物、动物的改良而提出来的。毕竟在植物和动物中大多数经济性状都是数量性状而不是质量性状。然而数量遗传不能够给人们提供选择的基础,预测调控连续型变异的基因。数量遗传的起源追溯到一个世纪以前,两组著名的英国科学家的争论产生的:生物统计学家和孟德尔学派。

生物统计学派是开始与Francis Galton 研究人类的一些特征例如身高是如何从父母遗传给后代开始的。

Galton 观察到均值回归,例如高个子父母倾向于生出比他们矮的孩子,而矮个子父母倾向于生出比他们高的孩子。对于身高这个性状,Galton 估计后代在父母身高平均值上的回归值为2/3。假定父母的平均身高比人群平均身高高9cm,即使他们的后代在身高上各有不同,但他们的平均值理论上应该比人群均值高6cm。皮尔逊后来分析了高尔顿的数据,发现后代和父母身高之间的平均相关度为0.51。兄弟之间的相关程度稍微高一些达到0.53。通过高尔顿和皮尔逊的研究,表明人类中的连续型变异时至少是部分可遗传的,尽管其中的机制仍旧是未知的。

孟德尔学派的人则不认同这个发现,他们认为造成个体间差异是由于特殊遗传力的存在,而不是对一个连续型性状的观察。由于不能够区分连续型变异性状间的差异,因此他们认为这些性状是不可遗传的。DeVries 也将性状是否连续作为性状是否可遗传的标准。

在1918年Fisher 发表一篇关于“孟德尔假设下亲戚间的关联”的文章;缓和了两派间的矛盾。这篇开创性的文章也奠定了数量遗传学的基础。其中假设就是,性状是受到孟德尔基因控制的,而fisher则是假设连续型变异是受到多个孟德尔基因所控制的。Fisher研究后表明这种模型能够解释,导致之前生物统计学家所发现的亲本之间在连续型性状上的相关性的现象。

​ 期初Fisher对这个模型做出了两个假设:

  1. 个体之间是随机交配的

  2. 每两对等位基因之间相互独立

这两个假设使得可以通过用等位基因的频率来表达基因频率,同时群体满足Hardy–Weinberg 要求;最终可以通过单个基因座的效应来描述其对整个基因组的累积效应。在他文章的其他部分,Fisher还研究了多个等位基因的效应,连锁、不同基因型的选型交配、上位性。

​ Fisher的推导中关键在于,他将遗传效应划分为可传递的部分和不可传递的部分。其中可传递的部分,是由其父母遗传给后代的。从那之后,等位基因的传递效应也被估计为等位基因的平均效应。而两个不同的等位基因间平均效应所产生的方差也被称为加性方差Va。此外非传播效应就涵盖了很多因素,包括等位基因的优势偏差、环境的影响等。其中优势偏差与误差大致相同;有优势偏差产生的效应也被称为优势方差。同时Fisher认为等位基因在不同基因座上产生的效应是在线性模型中更高维度的效应。

​ Fisher对高尔顿的研究进行进一步分析,并且对父母和后代之间构建了一个模型½VA/(VA + VD). 由于优势偏差与随机误差没有什么区别,将公式转换后为½VA/VP = ½h2, 其中Vp为表型变异,h2为狭义遗传力。回到身高的例子,假设父亲和群体身高的差异用S表示,父母之间的身高不相关,则后代的身高则可以估计成½h2S 。

​ 通过比较发现该公式与育种公式存在相关性R = h2S ,其中R是选择效应,S是不同的选择。而其中½是由于群体中没有对父母本进行控制导致R=½h2S 。通过历史的发展表明数量遗传学最开始是被当做基础科学而不是应用科学,而数量遗传学为设计育种提供了一个框架,更高效的找到对应的遗传效应。

为什么要在植物育种中重新定义数量遗传学

这些年来,科学家研究如何将数量遗传与植物育种更好的融合在一起。1940年对杂种优势的研究和轮回选择模式解决了种系间杂交的局限性,1950~1960年被认为是数量遗传学发展的黄金年代,研究了亲本之间的协方差,通过不同的交配设计去估计加性偏差、优势偏差和上位性变异。通过经验估计不同植物中的遗传变异,基因型和环境之间的互作,遗传稳定性分析,多个性状的指标选择。1970年开始使用同工酶酶切位点作为分子标记。1980年开始,在育种中严格的选择父母本,一直延续到1990年;引入QTL的连锁映射、关联映射、全基因组预测、表型分型、环境分型和基因编辑。

进入2020年,植物育种与过去相比发生了显著性的变化,之前描述的一些旧的数量遗传方法可能已经被淘汰。以下包括了三个重塑数量遗传的原因:1.育种目标发生了改变。2.假设前提发生了改变。3.新工具的产生。

育种工作者对数量遗传的期望发生了改变

半个世纪前,育种工作者想通过数量遗传回答以下三个问题:

  1. 哪种种质资源最有前途

  2. 应该开发哪种类型的品种或产品

  3. 应该使用哪种繁殖方法

数量遗传确实可以回答以上问题,一个种质如果具有较高的均值和较大的遗传方差就可以认为是一个有前途的种质;结合均值和遗传方差就可以在种群选育出最优的单株。在玉米中存在很多杂种优势和偏性方差的例子,表明杂交或者合成品种是非常适宜种植的。同时可以使用不同类型的轮回选择方案来对Va、Vd和非遗传方差进行估计;鉴定出哪种育种程序会产生最大效应。

然而现实是,无需任何详细的定量遗传分析就可以获得前两个问题的充分答案。例如大量的种质就可以通过表型识别,基于分子标记也能够区分出种质的起源和差异。大量杂交品种优于双亲,因此对杂交种的估计就可不需要估计Vd值。至于第三个问题,在不同的繁殖方式中预测的R值是不一样的,例如半同胞轮回选择,全同胞轮回选择。例如在主要的作物中玉米、水稻、小麦、西红柿采用的是双亲杂交的非递归而不是种群中的长期递归。由于重组的近交系中,差异恒在2Va内,通过不同的方法计算得到的效应几乎是没有差异的。

现在的育种工作者期望通过数量遗传从一个连续性状中直接使得表型值最大的候选位点。基因型值将会作为表型的期望值,候选者可能是单个植株、部分自交系、或者重组自交系。与50年前的侧重点不同,现在只强调基因型具有价值的品种,并且目标更加明确。

在植物育种中数量遗传的假设不满足

经典的假设就是:

  1. 种群内随机交配

  2. 各个位点之间独立

在轮回育种的繁殖方式中,种群内是满足随机交配的,例如在牧草等植物中。但是在在诸如玉米、小麦中却不满足。在双亲杂交F2中满足1:2:1的基因型比例,这个群体是满足随机交配的,可以估计Va和Vd,但仅仅是在一个给定的F2群体中。在大多数情况,种群内部是不满足随机交配的。在玉米育种中专注于维持谱系,或者每次只结合少量的品系。这些主要谱系存在着明显的优势,表明育种过程中不满足假定的随机交配。

分离基因间的连锁平衡或者独立性也是一个问题,基因座之间需要经过多代的随机交配才能打破连锁,这对于紧密连锁的基因座更是如此。虽然育种家有时候会尽可能的创建经过多代随机交配的群体,这是一种非常耗时的工作。不满足这些假设,就需要我们推出新的理论来规避这些假设。

新的计算工具的产生

两项技术的发展为数量遗传和植物育种提供新方法。首先就是新的高通量分子标记的出现。最开始的时候育种工作者和遗传学家使用同工酶标记,之后到RFLP、SSR等。随之出现的就是SNP分子标记,与以往的标记不同的是,它具有高通量的特性。随着测序技术的发展,SNP测序也越来越便宜。

第二个就是计算机的发展,促进了数据的分析和模拟。如今的计算机可以进行大规模的数据分析,例如求解含有200多万个未知数的方程,进行统计采样、例如自举法和交叉验证法。

Something old, something new, something borrowed, something BLUE

在植物育种中重新定义数量遗传,需要回顾经典的概念和方法;保留有用的东西,舍弃掉过时的,同时加入一些新的想法。同样有一个疑问是否需要开发一种新的方法,因为对方法的改变可能会使得数量遗传被滥用。作为实践者,我们都可以彼此沟通,因为我们遵循这相同的惯例。如果我们希望科学是精准而严谨的话,我们就应该准确的定义一些概念。

Old: multiple loci plus environmental effect

正如fisher假设的那样,多个孟德尔等位基因座共同作用于数量性状。无需对基本QTL数量进行假设,对于大多数性状,调控性状的QTL数量是非常多的,然而每个基因座产生的效应却是很小的。最核心的建模是P=G+E,其中P是表型值,G是遗传效应,而E则是非遗传效应。在环境J中,基因型i对表型的贡献可以量化成 Yij ¼ μ þ gi þ ej þ ðgeÞij þ εij

其中 u是均值,gi是基因型i的,ej是环境j产生的环境效应。ɛij 是环境误差。其中经典的线性模型仍旧没有发生改变,这里仍旧存在多种方法模拟基因效应和环境效应。例如(ge)ij可以模拟成基因型i产生的相互作用得分

Old: identify candidates with the best genotypic value

植物育种工作者,致力于鉴定和选择出一些最高的表型值候选位点,并且这个效果会随着种群的增大而增大。某种意义上讲,植物育种一直在遵循p=G+E方程。G则是从P中预测得到的,当E效应为0的时候,这种预测也会更加精确。在现有的常规育种中,SNP标记对预测候选基因的基因型值是非常有成效的。通常使用GBLUP,SNP用于标记个体之间的相关性,基于最佳线性无偏估计方法,从一组相关联的、snp中计算出每个SNP的作用。当QTL的数目比较大的时候,不会存在主效QTL的时候,并且QTL在遍布于整个基因组。

Old: continue finding major QTL

主效QTL基因,例如在小麦中抗白叶枯病基因fhb1,水稻中耐潮性sub1,仍旧被应用在栽培品种的培育中。主效QTL含有较大的遗传效应,在育种中持续性的出现。主效QTL主要出现在一些例如表型,对生物和非生物逆境的忍受上,但是在产量性状上却很少检测到。

New: no need for a reference population in Hardy–Weinberg equilibrium

在植物群体中通常不会有满足随机交配这一假设,今天数量巨大的SNP,允许育种工作者追踪整个片段的染色体的遗传,因此随机交配这一假设不在需要满足。同时人们往往是鉴定具有高的基因型值,因此不在需要推断适用参考种群。

BLUE: mixed-model analysis

混合模型分析就包括BLUE估计的固定效应和BLUP估计的随机效应,被认为是分析常规育种中表现和SNP关系的有效框架。大田作物育种者通过评估一个或多个年份中几个地点中每个地点的同一组候选者来进行平衡的实验。但是,跨候选者,位置和年份的表型数据的整体高度不平衡。混合模型分析具有两个主要优势: 处理不平衡的数据,并且可以合并信息从亲戚那里通过一个或多个协方差矩阵获得随机遗传效应。

基于线性模型的混合模型分析可以等式 1或其扩展,例如线性模型从包括固定的遗传效应 扩展到主要的QTL、亚群、转基因或不同类型的细胞质,或固定的环境影响,例如氮肥水平或田间种植的先前作物。随机遗传效应可能对应于GBLUP中的品系,克隆或杂种,或对应于RR–BLUP中的SNP标记。标记之间的连锁反映在RR–BLUP的系数矩阵中,从而避免了假设连锁平衡的需要。

BLUP方法于1970年首次用于动物育种,通过人工授精程序评估了约1200头荷斯坦奶牛。首先在植物中使用BLUP是昙花一现,首先是通过将合并能力的估计值朝平均值的方向缩小,紧接着利用亲本间的信息来预测单个SNP的性能。令人鼓舞的是,自2000年代以来,混合模式分析已成为植物育种专业学生的常识,并在植物育种中很常见。混合模型分析的使用降低了遗传学的作用,并增加了统计学在数量遗传学中的作用。统计遗传学家奥斯卡·肯普霍恩(Oscar Kempthorne)早在30多年前就已经在动物育种中观察到这种趋势,他在动物育种理论进行了以下描述。

首先个体的基因是具有独立基因位点的基因群体中的随机基因,并且可以将环境效应视为高斯随机变量的实现。我们看到我们已经将整个理论简化为统计学中所谓的混合线性模型理论。结果是,所谓的动物育种理论被简化为具有固定效应和独立高斯随机效应的混合线性模型理论。具有最佳基因型值的候选者纯粹成为统计问题。总体而言,本文所述的数量遗传学的重塑以及涉及计算和经验的方法,都不是基于经典理论和假设的方法。随着表型和SNP数据量的增加以及其他类型数据的增加,这一趋势无疑将继续下去,并且为育种决策提供信息。

Previous数量遗传olderNextUntitled 1

Last updated 4 years ago

Was this helpful?