高质量基因组揭秘“活化石”

2021-06-23 17:46 来源:《中国科学报》

作为裸子植物银杏纲唯一的孑遗物种,银杏不仅具有特殊的科学研究价值,而且具有重要的应用价值。

近日,南京林业大学联合中国农业科学院农业基因组研究所在《自然—植物》在线发表了染色体级别的银杏参考基因组,这是目前已发表的组装质量最高的裸子植物参考基因组。

论文共同通讯作者、中国工程院院士曹福亮告诉《中国科学报》,这项工作为深入了解裸子植物基因组进化提供了新的视角。

典型的孑遗植物

裸子植物作为一类独特的植物种系,主要由4个支系组成:银杏纲、苏铁纲、松杉纲和买麻藤纲。

论文共同通讯作者、南京林业大学林学院教授尹佟明介绍,目前银杏纲仅存银杏1种。

实际上,银杏纲在远古时代非常繁盛,是和恐龙同时代的物种。银杏纲植物出现于晚石炭世,在侏罗纪和早白垩世达到极盛,广布于欧亚北美大陆的温带地区。然而,第四纪冰期后,该纲植物在中欧、北美等地全部绝灭,所以银杏又有“活化石”之称。

“该纲其余所有物种均为化石植物,因此银杏具有重要的科学研究价值。”曹福亮说,作为典型的孑遗植物,银杏的生殖方式和胚胎发育比较原始。

大而复杂的基因组

“银杏基因组硕大、杂合度高,且重复序列含量极高,因此很难获得高质量的银杏参考基因组。”曹福亮说。

尹佟明告诉《中国科学报》,人基因组是比较大的,有30多亿个碱基,而银杏基因组是人基因组的3倍多,接近100亿个碱基。银杏有12对染色体,而人类有23对染色体,1条银杏染色体的长度平均约为6条人染色体的长度。

“国际上已完成多个裸子植物的全基因组测序,包括挪威云杉、火炬松等,但多数基于二代测序技术,基因组组装质量不高。”尹佟明说。

论文第一作者刘海琳介绍,这项工作采用了最新的基因组测序技术,获得了大小为9.87G的参考基因组图谱,并装配到银杏12条染色体上,准确注释了27832个银杏基因组蛋白编码基因,取代了原版本基因组草图的基因,是迄今发表的组装质量最高的裸子植物参考基因组。

他们发现,银杏编码基因的内含子显著延长。“其他裸子植物也有这个现象,而银杏编码基因的内含子比已报道的其他裸子植物编码基因的内含子要长很多。”刘海琳说,目前还没有对这一现象合理的解释,推测可能与重复序列的复制更活跃有关。

他们进一步分析,发现了银杏基因组扩张的机制。“全基因组复制事件是植物基因组扩张的主要原因。”尹佟明说,但他们确证,银杏只发生了一次全基因组复制事件,这与以往的研究结果不同。

“因此,银杏基因组的扩张方式主要不是通过全基因组复制,而是通过长末端重复序列插入和积累。”曹福亮说,分子证据显示,长末端重复序列最近的一次爆发时间在1200万~800万年前,发生在银杏全基因组复制事件之后。

揭示原始特征的分子机制

在获得了高质量的基因组图谱后,研究人员揭示了银杏一些原始特征的分子机制。

1896年,日本东京大学植物学家平濑作五郎发现了银杏具有多鞭毛的游动精子。在种子植物中,只有银杏和苏铁保留了精子鞭毛这一原始特征,显示出银杏在进化上的特殊地位。

“我们分析了20多种低等植物和高等植物,发现银杏和低等植物一样保留了精子鞭毛合成的相关基因,而这些基因在其他裸子植物和被子植物中都是缺失的。”尹佟明说。

此外,银杏为隐花植物,看不到花瓣、花萼、雌蕊、雄蕊这些花器官。刘海琳说,通过比较基因组研究,“我们发现导致这些花器官消失或隐藏的原因是一些关键性功能基因的缺失”。

银杏叶片两面特征相近,无明显极性。通过进一步分析,他们发现,银杏基因组中缺乏叶片极性相关的多个关键基因,造成关键合成通路阻断,无法显示极性特征。

“这在基因组水平上阐明了银杏特殊的花器官和叶片极性特征形成的遗传基础。”曹福亮说。