【The scientist】基因组大盘点 返回

随着高通量测序的发展,植物领域的辉煌也延续到了基因组研究中。The Scientist杂志盘点了近年来的植物基因组成果,向人们展现了植物基因组的奇妙世界。

首先,让我们来玩个猜谜游戏,猜猜细胞、基因、突变、转座子、 RNA 沉默和 DNA 重组的共同点是什么?

答案:它们都是首先在植物中发现的。听起来挺夸张的吧,但事实就是如此,植物生物学家们很乐意提醒你还有多少重量级成果源自于植物。随着高通量测序的发展,植物领域的辉煌也延续到了基因组研究中。

日前,《科学家》(The Scientist)杂志盘点了近年来的植物基因组成果,向人们展现了植物基因组的奇妙世界。

疯狂的基因组规模

Paris japonica 拥有目前已知的最大真核基因组(1500 亿个碱基对,50倍于人类基因组)。

日本重楼Paris japonica本是一种很普通的植物,直到Jaume Pellicer使用流式细胞仪分析了它的细胞。Pellicer发现,P. japonica细胞核中的 DNA 团特别大。不久,他通过测序证实了这一点,P. japonica拥有目前世界上最大的真核基因组,达到了150 billion bp,是人类基因组的50倍。

Utricularia gibba 的基因组只有82 million bp,是基因组最小的植物之一。

两年后,Buffalo大学的Victor Albert向人们展示了一种基因组特别小的植物。他和同事测序了丝叶狸藻(Utricularia gibba)的基因组,发现它只有82 million bp,是基因组最小的植物之一。有趣的是,它的基因组并不是因为基因少才那么小,实际上丝叶狸藻的基因数比葡萄、木瓜和拟南芥还要多。这种植物97%的基因组都是蛋白编码基因和基因调控区域,只有3%未知功能的“垃圾” DNA 。这与人类基因组完全相反,人类基因组的98%是“垃圾” DNA ,只有2%的蛋白编码基因。

这一发现挑战了ENCODE项目之前发表的一系列研究。这些发表于2012年九月的文章总结道,80%的人类基因组包含“功能性片段”。ENCODE研究者们认为,只要非编码序列转录成了 RNA 就应认为其具有功能。但Albert和一些比较基因组学家并不买账。“生物学活性不能跟功能性划等号,”Albert说。 DNA 被转录并不意味着一定投入使用。

疯狂的转座子

基因组扩容主要是两种机制的结果:整个基因组加倍,和转座元件TE的复制。前者在植物中很常见,会形成含有多个基因组拷贝的多倍体。后者在动物基因组中更为常见。例如,人类基因组充斥超过一百万拷贝的转座子ALU,该转座子一般没有功能。

转座子常常被比喻成寄生虫,长期了以来人们一直不清楚它们在基因组中的增殖机制。为了研究转座子对基因组演化的影响,加州大学的分子生物学家Sue Wessler,找到了转座子仍在移动和增加拷贝数的生物。这样的生物并不好找,因为绝大多数植物和动物拥有严密的转座子控制机制。如果没有这些机制,转座子很可能大量插入到重要的启动子和基因中,引发严重的问题。

上世纪九十年代,Wessler发现了一种新的转座子MITE(miniature inverted repeat transposable element),MITE广泛分布在一些植物基因组的非编码区域,其中就包括水稻(Oryza sativa)。2003年他的团队发现,水稻每传一代转座子mPing(一种特别的MITE)的拷贝数就增加25-40。Wessler不禁感到好奇,这种转座子为何没有扰乱植物的生理机能呢?

2009年她找到了答案,尽管mPing倾向于插入附近的基因,但它避开了外显子,也就是说这种转座自很少破坏基因功能。这一元件偏好富含AT的序列,而水稻的外显子组富含GC(这一点与其它植物不同)。乔治亚大学的Wayne Parrott将mPing插入大豆基因组,发现它会非常频繁地插入基因的外显子区域。“这说明成功的转座子与其宿主联系紧密,”Wessler说。

转座子只是微小的寄生虫么,还是说它们在基因组中的存在也有某种意义?一些人认为转座子对于种群来说是内置的多样性生成机制。例如,Wessler实验室发现,mPing插入水稻基因组可以使附近的压力基因得以转录。Wessler指出,通过插入到启动子区域甚至基因中,转座子能够向种群引入新的等位基因。这一现象不仅限于植物,有证据显示转座子也能为动物基因组带来多样性。举例来说,人类适应性免疫系统的基因,只够细胞生产20种抗体。幸好转座子将这些基因重新洗牌,免疫细胞才能够生产两百万种抗体对抗入侵者。另外,在动物的早期大脑发育中,转座子也特别活跃。

疯狂的基因组倍增

尽管转座子能撑大基因组,但植物的巨大基因组主要还是来源于基因组倍增。植物的基因组倍增,居大多数是因为细胞分裂出错,形成了包含两套以上染色体的多倍体。因为某种未知的原因,这一现象在植物中特别常见。实际上,所有的开花植物都在进化过程中经历过基因组的加倍,例如八倍体的日本重楼和四倍体的棉花。

1949年,植物学家Marion Ownbey注意到一种奇怪的Tragopogon属植物。他经过进一步研究发现,这种植物是两种Tragopogon杂交形成的,这种被称为T. mirus的植物拥有的染色体数是其双亲的两倍。上世纪九十年代中期,夫妻档Douglas和Pamela Soltis开始对T. mirus进行研究。2000年他们在T. mirus的细胞核中观察到了两个基因组的融合,包括基因表达的改变、染色体快速改组、基因易位和甲基化的改变。除了这些分子变化,Soltises夫妇还向人们展示了多倍体被自然选择垂青的直接证据。此外,其他研究也证实,对于农作物来说多倍体的生命力更强。

疯狂的进化

还记得那位“拥有鹰的眼睛,狼的耳朵,豹的速度,熊的力量”的警长么,植物也可以这样博取众家之长,通过物种间的基因交换(特别是线粒体 DNA )。

在寄生植物与其宿主之间,或者一起生长的两种植物(例如嫁接)之间,都可能发生基因交换,印第安纳大学研究基因水平转移的Jeffrey Palmer说。最近Palmer 在Science上发表文章指出,无油樟从其他陆生植物和绿藻获得了线粒体 DNA 。(Science:线粒体融合实现基因“大迁徙”)

在绝大多数情况下,植物的水平基因转移并不会影响生物的表型。但少数情况下,外源基因能够替代原本的基因,在基因组中承担起活跃的功能。2012年,研究人员发现毛颖草属(Alloteropsis)从其他植物获得了C4光合作用所必需的基因。C4光合作用能够帮助植物更有效的固定碳。研究显示,只有拥有这些基因的Alloteropsis,才能进行C4光合作用。

除了水平基因转移,植物还能通过传统的突变方式来引入新等位基因,这一次植物又做到了极致。

研究显示,Geraniaceae的基因组拥有最快的突变率,这种植物能帮助人们理解生物体内多个基因组的共同演化,例如细胞核基因组和线粒体基因组。研究人员认为geranium的 DNA 修复系统可能发生了某种改变,让它的三个基因组(叶绿体基因组、线粒体基因组和细胞核基因组)能一同发生高速突变。

另外,Palmer经过测序发现,鹅掌楸的线粒体基因组是目前突变得最慢的。鹅掌楸简直就是个活化石,Palmer认为这种树的 DNA 修复系统肯定特别好,对它进行研究可以帮助我们防止有害突变的发生。

“植物是比较基因组学和其他一些研究领域的理想模型,”Palmer总结道。他预言道,尽管Science和Nature上常常充斥着各种动物研究,但植物一定会催生更多令人兴奋的成果,只不过需要人们擦亮眼睛。