【原创】高粱重测序文献解读 返回

今天基迪奥给大家解读一篇高粱重测序文章,这篇文章发表在2013年8月的《Nature communications》杂志上。
全基因组重测序揭示高粱未开发的遗传潜力


研究方法:
来自中澳两国的科学家对44株不同来源的高粱品种进行了平均深度为22X的全基因组重测序,对群体结构进行了分析,并筛选与驯化和改良相关的基因。

研究对象:
44株不同来源的高粱(包括7株野生品种、18株地方品种、17株改良自交品种、2株来自西非的地方品种)、和2株近缘种(S. propinquum,拟高梁)。

下面的关系图能非常清晰地看出不同品种间的进化关系:


文章思路分析:

文章气势恢宏,内容很多,看似很复杂,其实很有条理,从文章思路上看可以划分为4部分,按这个思路看这篇文章,就会感觉清晰明了。
并且,通常选择进化文章都会包含“群体结构”和“选择分析”这两步,然后可以或细化讨论某些基因和通路、或讨论别的方面(如本文的大效应变异)。


一. 测序数据和变异统计
遗传变异如SNP, InDel等是后续的群体结构分析、进化选择分析的基础,所以文章当然少不了首先对这些遗传变异进行统计、注释和分析。

1、文章鉴定出了大量的SNP, InDel和CNV,这些变异绝大部分位于基因间区,编码区则相对比较保守。
2、野生品种比地方品种和改良品种有更多、密度更高的SNP,改良品种的SNP数目和indel数目最少。西非品种Guinea-margaritiferum的SNP密度是地方品种的两倍。另外,θπ和θw检验结果也表明了改良品种的基因多样性最低。

这些结果表明遗传多样性在高粱驯化和改良的过程中不断下降,并且发生了遗传瓶颈效应。同时也提示了野生高粱种质具有很大的开发和改良潜力。


二. 群体结构和种群历史分析
进化树结果显示,西非品种Guinea-margaritiferum处于栽培种和野生种之间;PCA分析和群体结构分析结果表明Guinea-margaritiferum离群。不同的研究方法都揭示了相同的结论,即高粱品种之间强烈的种群结构差异和复杂的驯化历程,并证实了Guinea-margaritiferum是发生在西非的第二次独立驯化事件所产生的品种。


另外,作者也通过各种统计学方法,验证高粱野生品种和栽培品种发生了分离。

【小知识】通常,检测正向选择的信号有以下三方面:
1)连锁不平衡(LD)增加;
2)Tajima’D, Fay and Wu’s H, Fu and Li’s D, F曲线等中性检验曲线偏移;
3)遗传多样性下降,表现为θπ,θw,HKA等检验值降低。


1. 在改良品种中LD显著增加,这是驯化正向选择的结果(上图)。
2. 栽培品种的θπ和θw值都显著比野生品种降低(前面的SNP统计表)。
结果表明,高粱栽培种与野生种之间出现了明显的种群分化,在高粱驯化与改良历程中其遗传多样性不断下降。


三. 全基因组扫描筛选受驯化选择基因
然后,文章最重要的部分,就是在全基因组范围内筛选受驯化正选择的基因。

鉴定的方法:
使用θπ,θw,Tajima’sD和FST等统计量来鉴定,在全基因组范围内搜索在不同品种间遗传分化增加、核苷酸多样性下降、变异频率谱线偏移的基因区域。

并设置了三个比较组,来找出分别在驯化和改良阶段受选择的基因:

对于θπ,θw,Tajima’s D和FST这几个统计量,其实都是涉及遗传多态性和进化选择的专业统计量,这里就先简单科普:

• Θπ:群体中任意两条核苷酸序列差异的平均值;
• Θw:又叫Watterson估值,群体突变率的估计值,公式为θW=4Neμ,Ne为有效群体大小,μ为每个位点的突变频率;
• Tajima’s D:一种最常用的中性检验,通过比较群体突变率的两个估计值θπ 和θw的差异检测正向选择效应;
• FST :F统计量,估计亚种群间平均杂合性大小与整个种群平均杂合性大小的差异,0<= FST <=1, FST为1 表示亚种群间存在明显的种群分化。

在本文中,这几个统计量的参数如下:FST ≥95%;θπ,θw在祖先种中较高,在子代种群中≤10%;Tajima’s D值在子代种群中是负的。

结果总共找到725个与驯化和改良相关的候选基因,其中33%(285个)的驯化候选基因呈现出改良历程中的受选择信号,预示着这些基因在农艺性状改良上有着重要的作用。

对这些候选基因进行基因功能注释,发现功能富集于生物胁迫和非生物胁迫引起的植物激素响应,例如GH3,SAUR, IAA基因家族。这些驯化与改良候选基因为鉴定与农艺性状相关的基因提供了宝贵的资源。

通过这种选择压力分析得到的这些候选基因涉及的性状多种多样,涉及的基因功能也多种多样,如:
dep1 :产量提高相关基因(水稻)
Psy1:控制种子颜色(玉米)
Bif1:株型(玉米)
还有好多与驯化农艺性状相关的基因,如种子相关性状、植株颜色、株高等。

下面我们以一个具体的基因(dep1)来看看具体怎样分析:

dep1基因所在的区域:
A)地方品种π值小于野生种(多样性下降)
B)地方品种D值为负值(潜在受选择)
C)群体间的分化程度(Fst值)在基因组范围属于最高的5%(两个亚群间有差异)
这个策略可推广到整个基因组,在全基因组范围内扫描,找出受驯化候选基因。


四. 大效应变异检测
最后文章对大效应SNP、读码框移位indel,大片段缺失,新基因等进行检测,也得出了一些有意思的结论,如西非品种拥有最多的大效应SNP和读码框移位indel,这提示了西非品种独特的遗传特征具有潜在的开发潜能。

总结:
这篇11.47分的文章气势很恢弘,结果很丰富,总结起来就是以下几点:
1、高粱地方品种和改良品种的遗传多样性下降;
2、不同的高粱品种在基因组中存在着强烈的种群结构差异和复杂驯化历程;
3、在全基因组范围内找到725个与驯化和改良相关的候选基因;
4、找出了一系列的变异位点,提示高粱地方品种、西非品种和拟高梁都存在着尚未开发的丰富的多样性潜能。

选择进化分析可以得到很多的候选基因,若对其中某几个重要基因和通路展开详细解读,也可以使得文章非常聚焦、重点突出(之前分享的狗重测序文章也是一样,推荐大家去看看)。本文从一个大的角度整体研究了高粱的种群进化历史、筛选了大量的驯化相关基因,为高粱及其他谷类作物的遗传多样性研究和育种改良提供了丰富的资源和重要的科学依据。


可学习借鉴的地方:
1. 样品选择设计:
本文选择了三个高粱品种(野生种、地方种和改良自交系),因此可以研究高粱的两个驯化事件,分别找出驯化和改良过程中受选择的基因;另外,还选择了两株西非品种来研究高粱在不同地域的独立的驯化事件。

2. 文章结构:
如前面的文章总体框架图,我们可以学习到这类文章的主要思路,就是
变异检测——群体结构分析——选择压力分析——细化讨论或其他讨论


更多基迪奥的原创文章,可继续关注我们网站动态发布,同时关注基迪奥微信~扫一扫添加基迪奥好友~随时随地关注行业动态!