【原创】解读一篇Nature重测序文章 返回
这次基迪奥给大家解读一篇Nature重测序文章,是有关选择压力分析的。该文章是“狗驯化过程中的基因组特性揭示其适应富含淀粉饮食的机理”。
什么是选择压力分析
选择压力分析(selection screening)的本质是受选择区域的基因杂合率下降,因此在基因组不同区域进行扫描,观察基因多样性(杂合率)的变化,那些杂合率下降的区域就是受进化选择的区域,其中的基因就是潜在受选择的基因。
可研究不同亚群之间受选择的基因,如动植物驯化过程中受正向选择的基因。
上图:选择压力分析原理图。
TakedaS. Nature Reviews Genetics, 2008, 9(6):444-457.
经过进化、驯化等选择后,基因组上某些位点会丢失一些等位基因,因此多样性下降,反应在基因杂合率下降。
文章的研究思路:
狗是人类的好帮手和好伴侣,然而狗的祖先是凶残食肉的狼,究竟如此可爱温顺的狗是怎样进化而来的呢?在驯化过程中又发生了什么基因、分子层面上的变化,使得狗不再凶残并适应人类生活呢?这其中发生的基因组变化几乎不见有研究报道。因此这篇文章的目的就是找出狗受驯化选择的基因,并揭示狗适应富含淀粉的饮食的分子机理。
测序策略:进行混合池全基因组重测序。
材料:一个狼DNA池:12只来自世界各地的野狼,6.2X;五个狗DNA池:共60只狗(14个品种),共29.8X
因为选择压力分析出来的受选择区域可能与各类性状相关,这需要找出具有生物学意义的关键性状进行解读。而这篇文章在数据解读方面集中聚焦于淀粉消化吸收相关通路和基因上,讲清了一个人类历史上驯化动物的故事,这也是这篇文章能发Nature的重要原因。
第一步:选择压力分析
1.为了找出狗基因组受选择的区域,作者对狗全基因组进行扫描,寻找狗基因杂合率下降的区域(HP)和遗传距离增加的区域(Fst),具体为寻找两个群体显著分化(Z(Fst)>5)和狗基因杂合率显著下降(Z(HP) < -5 )的区域。这两种方法共找到包含122个基因的36个常染色体候选区域。
2. 对受选择区域内的基因进行GO功能分析,发现这些正选择基因的GO功能包括神经系统发育、精子与卵子结合、淀粉代谢过程等。
其中, 6个区域里的10个基因与淀粉消化、脂肪酸代谢相关。因为狗的祖先狼是肉食性的,作者推测这些基因在狗驯化过程中受到了正选择,使得狗发生了从肉食到富含淀粉的饮食习惯的改变。因此,文章之后的篇幅都是通过各种方法验证这些候选基因受到正选择。
第二步:聚焦目标通路和基因
验证与淀粉消化吸收三个步骤相关的基因受到正选择
首先描述一下淀粉消化吸收的三个步骤和本文中筛选出来的关键基因:
1)淀粉在小肠中被α-淀粉酶水解为麦芽糖或其他低聚酶;
受正选择的基因:AMY2B(α-淀粉酶麦芽糖酶)
2)低聚酶被麦芽糖酶、蔗糖酶和异麦芽糖酶继续水解为葡萄糖;
受正选择的基因:MGAM(麦芽糖酶)
3)葡萄糖利用SGLT1蛋白通过细胞质膜被吸收
受正选择的基因:SGLT1(葡萄糖转运蛋白)
关键基因的验证方法:
由于混合池测序淹没了个体信息,所以需要对关键基因在群体水平进行个体验证。
群体验证内容:
1)基因拷贝数(CNV);
2)单倍型分布;
3)关键突变(非同义突变在两个种群中的差异);
4)基因表达量或酶活的差异。
1)AMY2B(α-淀粉酶)的验证:
这个基因位于6号染色体的一段600kb候选区域内,Z(HP)和Z(FST)分别为-4.6和7.16。
整体序列差异分析和qPCR分析显示,狗群体该基因的拷贝数增加,平均为狼的7.4倍;检测该基因的表达量和酶活性,结果显示表达量和酶活性均显著增加。这些结果表明α-淀粉酶基因拷贝数的增加提高了狗淀粉酶的活性,从而更好地适应淀粉饮食。
2)MGAM(麦芽糖酶)的验证:
MGAM(麦芽糖酶)涉及到淀粉消化吸收的第二步,但并没有发现MGAM的基因拷贝数发生变化。单倍体型分析发现在验证的71只狗中,68只带有一段124kb长的单倍体型,而在狼中没有这段单倍体型,提示这段单倍体型可能携带受正选择的基因变异。
然后对MGAM基因上的特定SNP进行分析,发现这些SNP在狗和狼两个种群中存在显著的差异。
同样对该基因的表达量和酶活性进行检查,结果显示表达量和酶活性均显著增加。这些结果表明MGAM基因在驯化过程中受到了正选择。
3)SGLT1(葡萄糖转运蛋白)的验证:
SGLT1基因位于26号染色体的一段候选区域内,单倍体型分析鉴定出一段在狗和狼两个群体中高度差异的50.5kb长的单倍体型。接着分析这段50.5kb区域内的SNP变异,发现一个异亮氨酸到缬氨酸的替换可提高狗吸收葡萄糖的效率。但SGLT1基因的表达量在狗和狼中并没有显著差异,表明了这个基因在驯化选择上经历了结构突变,而不是功能突变。
总结
这篇文章通过选择压力分析,鉴定出了在狗驯化过程中与淀粉消化吸收相关的三个基因受到了正选择:AMY2B,MGAM和SGLT1,揭示了狗适应富含淀粉饮食的分子机理。
饮食习惯的改变,是狼驯化为狗的非常关键和重要的一步,这使得狗的饮食习惯逐渐与人类一致,因此渐渐适应了人类生活。
这些结果也揭示了人类与狗的共同进化,因为当时正值农业革命时期,人类也是渐渐从肉食性过渡到淀粉饮食吧。
更多基迪奥精彩原创文章,可继续关注我们网站动态发布,同时关注基迪奥微信~扫一扫添加基迪奥好友~随时随地关注行业动态!