多倍体基因组在陆地植物中的演化:进展与展望
多倍体(即细胞中含有三套或更多完整染色体组)是植物演化过程中一种普遍现象,深刻影响着基因组的结构、功能与动态。全基因组复制(WGD)事件发生后,基因组通常会经历重组阶段,包括编码序列的丢失、假基因化、亚功能化与新功能化、表观遗传重塑以及染色体重排等过程,这些过程共同促使基因组在演化时间尺度上逐渐实现遗传和细胞学上的(再)二倍体化。多轮多倍化及随后的二倍体化循环,塑造了几乎所有被子植物、许多蕨类和石松类植物,以及部分苔藓植物和裸子植物的基因组。
苔藓植物
大多数苔藓植物拥有相对较小的基因组,但其核型多样性比以往认知的更丰富。传统观点认为WGD在苔藓植物中可能罕见或缺失,但近期基于核基因数据的系统发育分析揭示了至少7次古代大规模基因复制(LSGD)事件。不过,全基因组数据并未完全支持这些LSGD事件均源于多倍化。例如,在苔藓植物中已确认5次古代WGD和至少15次谱系特异性WGD(主要存在于藓类中),而角苔和苔类中发现的WGD事件较少。功能富集分析显示,不同LSGD事件保留的重复基因具有独特的功能偏好,例如LSGD1和LSGD7与光合作用相关基因显著富集,可能与适应陆地环境有关。尽管苔藓植物中推断的WGD事件相对较少,但其基因空间多样性很高,部分由水平基因转移(HGT)驱动,暗示WGD在苔藓中产生功能新颖性的作用可能不及其他植物类群。与种子植物相比,苔藓植物染色体上基因顺序重排速率较低,保持了更高的同线性和共线性,且转座元件(TEs)与基因在染色体上分布均匀,这一特征也见于其他无种子植物谱系。
石松植物
作为现存维管植物的姐妹群,石松植物(包括石松、卷柏和水韭)的基因组通常较大,暗示多倍化可能促进了其基因组扩张。WGD的发生在不同谱系间存在差异:水韭推测有一次古代WGD,卷柏缺乏共享的WGD历史,而石松则经历了多次WGD。比较基因组学分析发现,同型孢子石松物种间尽管分化时间长达3.5亿年且经历了独立的WGD事件,仍保持高度的基因共线性,显示出惊人的基因组稳定性。这与异型孢子卷柏和水韭的基因组演化模式形成对比,表明同型孢子与异型孢子可能与不同的基因组演化速率相关。
蕨类植物
大多数蕨类为同型孢子,具有高染色体数目和大基因组。这被认为与多倍体高发生率以及二倍体化过程中相对较少的DNA丢失有关。除了推断存在于所有现存蕨类最近共同祖先(MRCA)的一次古代WGD外,不同蕨类支系中还发现了多次谱系特异性WGD。研究表明,具有更多古代WGD的蕨类谱系通常物种更丰富。近期、反复发生的异源多倍化事件可能促进了许多蕨类属的近期辐射。蕨类基因组大小的增加通常与WGD、转座元件积累和内含子扩张有关。同型孢子与大型基因组和高染色体数目之间存在关联,而异型孢子蕨类则拥有蕨类中最小的基因组。不同生活型(如树蕨)也可能导致基因组动态差异,例如树蕨在最近一次WGD(1-1.7亿年前)后保持了高度的同线性,暗示其二倍体化速率较慢可能与乔木习性的起源相关。
裸子植物
裸子植物(包括苏铁、银杏、买麻藤类和松柏类)中,一个古老的WGD事件发生在所有种子植物的MRCA已被证实,但一个所有裸子植物共享的WGD事件仍存争议。古代WGD在裸子植物中被认为较为罕见,对核型演化影响有限,但买麻藤类中的百岁兰存在明确的WGD证据。相比之下,谱系特异性多倍体在裸子植物中有确凿证据,例如买麻藤属的麻黄以及柏科植物(如杜松和六倍体海岸红杉)。裸子植物基因组演化轨迹多样:非松柏类裸子植物基因组较小,经历了谱系特异性WGD和类似被子植物的多倍化后基因组缩减(以SOLO-LTR为主);而松树等大型基因组则富含完整的LTR反转录转座子,基因组缩减缓慢,可能导致类似“基因组瘫痪”的状态。对裸子植物系统发育进行更密集的基因组采样对于理解其演化轨迹至关重要。
被子植物
被子植物是多倍体研究的焦点。所有被子植物MRCA的WGD被认为可能为其演化成功贡献了基因组新颖性,而不同时期反复出现的谱系特异性WGD也与被子植物物种多样性和生物量优势相关。高通量测序、长读长和单分子测序技术的进步,以及专门为多倍体系统基因组分析开发的工具,极大地推动了对多倍体与基因组结构、基因剂量平衡、形态、生态适应和谱系多样化之间复杂相互作用的研究。新技术如“有丝分裂替代减数分裂”(MiMe)系统可用于产生克隆未减数配子,实现精确的基因组操作。泛基因组分析、比较表观基因组学以及生态位建模等研究正不断深化我们对多倍体演化的认识。例如,对异源多倍体水稻及其二倍体祖先的泛基因组比较表明,二倍体化的节奏因突变类型而异;对棉科植物的系统基因组分析揭示了古代异源多倍化事件(高达十倍体)及随后的非整倍体化是该科多样化的驱动力。
未来方向
许多WGD事件,特别是在非被子植物基部分支节点推断的WGD,仅基于转录组数据,需要利用更全面的基因组数据(理想是T2T基因组组装)进行验证。改进组装算法、整合人工智能技术、将多倍体作为群体过程进行建模(结合群体水平基因组采样)是未来的关键。目前陆地植物各谱系的基因组覆盖度极不均衡,阻碍了跨大类群多倍体基因组演化的比较及普遍演化趋势的识别。建议在陆地植物中建立模型类群,生成代表性类群的高质量全基因组序列,这将有助于解决一系列核心问题,例如:不同类群多倍化速率差异的原因;谱系多样化是由多倍体本身驱动还是多倍化后相关因子驱动;不同谱系基因组动态和二倍体化速率差异的原因;多倍体如何影响植物与其他生物(如微生物组)的互作等。这种“基因组民主化”将为了解基因组动态和WGD的作用提供更广泛的基础。