Population Genomic Analysis and De Novo Assembly Reveal the Origin of Weedy Rice as an Evolutionary

​ 杂草水稻具有很强的入侵性、再生能力以及与栽培稻竞争资源;同时又缺乏有效的除草剂进行控制;使得它成为稻田里的主要威胁。但与此同时,作为栽培稻的近缘物质,杂草水稻又具有以下与野生水稻类似的特征;这就使得杂草水稻作为理解水稻驯化和改良的良好模型。对于杂草水稻的起源以及它的一些特有属性的形成仍旧是未知的,在对亚洲的低纬度地区的杂草水稻研究后,认为有一部分基因是从野生品种中流向杂草水稻的。

​ 在当前日益变化的气候和人口增长情况下,从杂草植物中克隆优良基因到作物中,能够提供农作物产量解决粮食安全问题。但是还存在一些限制因素,由于缺乏基因组信息,使得发掘优良基因和解析其遗传基础变得十分困难。

​ 高纬度地区的杂草水稻相比与栽培水稻经历着更强的自然选择压,因此可以用它的遗传资源来改良栽培稻的生态适应性。

系统发生树分析

通过结合多个品种的SNP数据,构建系统发生树

  • 48个高纬度杂草水稻 WRAH

  • 43 个温带栽培粳稻 Japonica-C

  • 26 个温带粳稻地方品种 Japonica-L

  • ...

系统发生树

图中可以看出,高纬度杂草水稻与地方品种进化距离比较近,而与栽培品种距离较远。

系统发生树

Selection Features in the WRAH Genome

一般来说在驯化群体的选择区间中,一些比较关键的基因通常会表现出低的多态性、等位基因的偏好性。

由于人为的选择某一性状,导致对应等位基因的多态性下降,同时某些等位基因的频率增加。衡量的指标有两个:

  • π 值越大遗传多样性越高

  • Tajima’s D 大于0表示群体稀有等位基因频率在逐渐下降,小于0表示群体稀有等位基因频率逐渐增加;等于0表示群体内选择达到平衡,等位基因频率维持不变

选择区域的特征

通过将WRAH与栽培稻、地方品种比较,发现π值更低、而Tajima’s D 值更高一些。进一步的使用window-based方法扫描整个基因组π值和Tajima’s D值。发现一些具有驯化或者改良基因有的特征(π值小、Tajima’s D值大);同时WRAH中一些与逆境相关的基因表现出未驯化或改良特征。在WRAH中那些π值高、Tajima’s D值大的区域可以理解成:这个区域稀有变异丰富同时选择达到平衡。

Features of Domestication in WRAH

基于WRAH群体的50k-SNP数据,计算了WRAH和 Japonica-M (栽培种和地方种的混合)的Fst值,同时将前5%Fst对应的SNP作为一个能够区分WRAH和Japonica-M 的数据集;这些Fst区域也是反映了WRAH和栽培品种间存在差异的地方。

Fst值越大,表明群体间分化越大

紧接着,针对这两个数据集分别进行改良信号、和驯化信号的计算。发现在杂草和栽培稻之间存在差异的区域中受到的改良信号要高于整个区域的水平;而驯化信号在两个数据集中是相似的。

说明遗传改良是造成杂草水稻和普通水稻分化的;

使用这两个数据集,计算野生种和WRAH、 Japonica之间的遗传距离,发现同样没有区别。这些结果表明前5%Fst对应的区域与改良位点重合,而与驯化区域是不一样的,说明 WRAH 起源于栽培稻驯化后。

Parallel Evolution between WRAH and WRSC

数目

为了检测WRAH(高纬度地区杂草)和WRSC(中纬度地区杂草),之间是否是独立的进化或者平行进化。分别检测了栽培稻与两个杂草稻的选择信号,以5%为阀值,发现了135和130个共享的离群值。同时检查了一些标记基因在1%的阀值、1Mb的窗口下,是否都会出现;发现了一些与驯化相关的基因在两个种群中同时出现。这些表明这两个杂草水稻物种经历的是平行的进化。

QTL Mapping for Weedy Traits

杂草水稻存在一些特有的表型,例如较高株高、红色果皮等;对应它们的遗传基础仍旧是未知的。通过对这些数量性状位点进行定位,能够更好的理解杂草水稻的进化。构建了一个由杂草水稻和栽培稻杂交得到的重组自交系群体,并且双亲P1、P2在一些性状上具有明显的差异。

总共5307个高质量的SNP被用于构建连锁图谱,覆盖了1804.16cM,平均每个标记间相距0.34cM;通过分析标记在染色体上的实际位置和遗传图谱上的相对位置,发现它们之间存在99%的相关性,说明这些遗传标记比较好。

1cM :表示在群体中,两个基因有1%的概率发生基因重组

通过高密度的遗传图谱,将遗传标记分为一个个连锁群分别与性状进行关联,根据连锁群的大小设置一个显著性阀值,得到对应的连锁区段,映射到对应的染色体区间上。

通过QTL定位,发现在1号染色体末端有着强烈的选择信号,说明这个区间存在一些优良基因用于改良栽培稻。

Demographic Scenario Analysis

基于近似贝叶斯方法估计WRAH起源的后验概率,

后验概率计算:

存在多个先验条件:比如A条件下事件发生的概率为80%,B条件下事件发生的概率为60%;A条件出现的概率为75%

当事件发生的时候,推断是A条件下发生的概率

通过构建多个进化模型,计算每个模型的后验概率大小,确定了连个最有可能的两个模型1、模型3。结合以有的研究,栽培稻出现的时间,与模型3最接近。

进化模型

Genome Sequencing, Assembly, and Gene Annotation

使用Hi-c数据辅助基因组的组装

原理: 染色质内部的互作大于染色质间的互作

比较不同水稻基因组中的基因家族

与栽培稻相比,杂草水稻(WRAH),Ka/Ks的值都比较大;说明杂草水稻受到更大的选择压。同时在ka/Ks值大于1的地方,比例也比栽培稻高,说明杂草水稻基因组中积累了更多的功能突变。

Ka/Ks值: 非同义突变/同义突变

在不存在选择的中行调节下,Ka/Ks值接近1

由于纯化选择的作用,使一些非同义突变Ka产生的有害突变被消除,保持蛋白质功能不变,这样就会使得Ka/Ks值小于1

在正向选择作用下,使得非同义突变产生的有利变异被保留,说明蛋白质逐渐在发生改变。

总结

通过比较杂草水稻与栽培稻等物种的进化关系,解释了杂草水稻的形成及进化。通过对杂草水稻驯化和选择区间的分析证明了杂草水稻是在水稻驯化后逐渐形成的。根据杂草水稻中一些与野生稻独有的特征表现,进行QTL定位,将基因定位到1号染色体臂端;说明这个区域存在一些杂草水稻特异的遗传资源。进行人口情景模拟,进一步证实了杂草水稻的进化历史。对杂草水稻的基因组进行从头组装,比较了基因家族的选择压,发现杂草水稻中累积了更多的功能突变,相比与栽培稻。总而言之,通过对杂草水稻基因组的组装,将会为水稻的遗传改良提供许多有益的遗传资源,更好的解析一些复杂性状的遗传机理。

参考

Last updated