对淫羊藿属(Epimedium L.)线粒体基因组的比较分析显示,在结构、基因共线性、细胞间基因转移以及RNA编辑方面存在异质性

时间:2025年11月24日
来源:Frontiers in Plant Science

编辑推荐:

线粒体基因组结构分析、RNA编辑、系统发育与重复序列研究为Epimedium属物种分类和基因组进化提供新依据。

广告
   X   

本研究聚焦于一种名为 *Epimedium* 的植物属,该属是小檗科中最大的草本植物属,包含约68个物种,主要分布在东亚至西北非的温带山区。中国是该属现代分布和多样性的中心,拥有58个物种,其中57个为特有物种。此外,还有4个物种分布于地中海和西亚地区,而另外5个则分布在日本。值得注意的是,*E. koreanum* 作为该属中分布最广的物种之一,其分布范围包括中国、韩国和日本,这反映了该属在东亚地区的广泛分布特征。*Epimedium macrosepalum* 和 *Epimedium elatum* 分别分布于远东俄罗斯和克什米尔地区。这些植物因其独特的药用价值,长期以来在中国传统医学中扮演重要角色,其中 *E. pubescens*、*E. wushanense*、*E. sagittatum*、*E. brevicornu* 和 *E. koreanum* 等物种已被收录于《中国药典》(2025版)中,用于其补益和治疗功能。然而,由于野外资源的过度开发以及形态相似物种的存在,目前该属的物种鉴定仍存在困难,导致药材质量不稳定,亟需更精确的分类手段和可持续利用策略。

### 1. 分类学挑战与研究意义

*Epimedium* 属的分类学研究一直面临较大挑战,主要源于其形态学上的高度收敛性以及频繁的杂交现象。形态特征在不同物种间往往表现出细微的差异,且这些差异难以准确区分,从而影响了传统分类方法的适用性。尽管已有多种分类方法被尝试,包括经典的形态学分类、化学分类以及基于染色体和分子标记的系统发育分析,但这些方法在某些情况下仍难以准确划分物种边界。特别是在中国,该属的物种在形态上存在显著的多样性,而遗传差异却相对较小,这使得基于形态的分类系统(如Stearn的分类体系)在实际应用中面临挑战。此外,许多物种仅通过花朵或叶片的微小差异进行区分,这进一步增加了分类工作的复杂性。因此,本研究旨在通过解析 *Epimedium* 的线粒体基因组(mitogenome)来补充分类学研究,为该属的系统发育关系和进化模式提供新的基因组证据。

线粒体基因组在植物进化研究中具有重要价值。它不仅参与多种代谢过程,还在能量代谢、基因表达调控、胁迫响应以及植物生长发育中发挥关键作用。线粒体基因组的结构和内容在不同植物中表现出显著的多样性,包括基因数量、重复序列、RNA编辑能力以及基因排列方式等。例如,一些植物的线粒体基因组以单一环状结构存在,而另一些则呈现出线性或分支结构。此外,线粒体基因组的进化速率通常较低,相较于叶绿体基因组和核基因组,其同义替换率要低得多。这一特性使得线粒体基因组在系统发育分析中具有独特的应用价值,尤其是在低等分类单位的划分中,能够提供更加稳定的信号。

### 2. 研究方法与技术路线

为了解析 *Epimedium* 属的线粒体基因组结构,本研究采用了 Illumina 和 Nanopore 两种高通量测序技术。首先,从中国达州农业科学研究院采集了三种代表性 *Epimedium* 物种的样本,包括 *E. sagittatum*、*E. pubescens* 和 *E. wushanense*。随后,使用 CTAB 法提取了高质量的基因组 DNA,并通过 Illumina 平台进行短读长测序,以构建初步的线粒体基因组草图。同时,利用 Nanopore 测序技术获得了长读长数据,有助于解决重复区域的组装问题,并完成完整的线粒体基因组序列。

在基因组组装和注释过程中,采用了多种软件工具,如 GetOrganelle 和 Bandage,用于构建线粒体基因组的图形化结构并进行可视化。此外,通过 BWA 对 Nanopore 数据进行比对,进一步完善了线粒体基因组的组装结果。基因注释则结合了 Geseq、IPMGA 以及 Apollo 等工具,对蛋白质编码基因(PCGs)、转运核糖核酸(tRNAs)和核糖体核糖核酸(rRNAs)进行了系统分析。最终,三种 *Epimedium* 线粒体基因组的组装结果被上传至 NCBI 数据库,并获得了相应的访问编号。

为了验证线粒体基因组的准确性,研究团队设计了特异性引物,对组装结果中的连接区域进行了 PCR 验证。PCR 产物通过琼脂糖凝胶电泳进行可视化,并结合 Sanger 测序进一步确认了基因组结构的正确性。此外,通过分析基因组中的重复序列,包括简单重复序列(SSRs)、串联重复以及分散重复,研究揭示了线粒体基因组在结构上的复杂性。

### 3. 线粒体基因组的结构与特征

研究结果表明,三种 *Epimedium* 线粒体基因组在结构上存在显著差异。*E. sagittatum* 的线粒体基因组为单一环状结构,总长度为 324,345 bp,GC 含量为 46.91%。而 *E. wushanense* 的线粒体基因组则由两个独立的环状分子组成,分别长 281,026 bp 和 72,800 bp,GC 含量分别为 46.82% 和 45.64%。相比之下,*E. pubescens* 的线粒体基因组具有更为复杂的结构,由三个环状染色体和一个线性染色体组成,总长度为 346,367 bp,GC 含量为 46.52%。这三种线粒体基因组的结构差异反映了该属在进化过程中可能经历的多样化事件。

基因组成方面,三种 *Epimedium* 线粒体基因组共包含 58 个独特基因,其中包括 36 个蛋白质编码基因、19 个 tRNA 基因以及 3 个 rRNA 基因。值得注意的是,某些基因在不同物种中表现出重复现象,例如 *atp9*、*rps2* 和 *trnP-UGG* 基因在所有三种 *Epimedium* 物种中均存在两个拷贝。此外,*rps13* 基因在 *E. sagittatum* 和 *E. wushanense* 中出现重复,而 *trnD-GUC* 则在 *E. pubescens* 和 *E. wushanense* 中重复。这些基因的重复现象可能与线粒体基因组的进化机制有关,例如基因复制或基因组重组。

在 RNA 编辑事件方面,研究共预测了 642 个 C→U 类型的编辑位点,分布于 35–36 个 PCGs 中。编辑事件不仅影响了基因序列的多样性,还可能通过改变起始和终止密码子,进一步影响蛋白质的合成过程。例如,*nad1* 和 *rps10* 基因的起始密码子经过编辑后变为 AUG(Met),而 *atp6* 和 *rps11* 基因的终止密码子则被编辑为 UAA(End)或 UGA(End)。这些编辑事件的验证通过 PCR 与 Sanger 测序完成,结果表明编辑位点在不同物种中表现出一定的特异性,可能与物种间的进化路径和基因调控机制有关。

### 4. 基因组的重复序列与结构多样性

重复序列在植物线粒体基因组中普遍存在,它们可能通过重组、复制或插入等方式影响基因组的结构和功能。在本研究中,三种 *Epimedium* 线粒体基因组中均检测到大量重复序列,包括简单重复序列(SSRs)、串联重复和分散重复。例如,*E. sagittatum*、*E. pubescens* 和 *E. wushanense* 的线粒体基因组分别检测到 77、83 和 89 个 SSRs,其中单体和四体重复序列占比较高,分别达到 71.43%、71.08% 和 70.79%。值得注意的是,三种 *Epimedium* 线粒体基因组中均未检测到六体重复序列,这可能与它们的基因组进化路径有关。

此外,三种线粒体基因组中还检测到大量分散重复序列,包括回文重复、正向重复、反向重复和互补重复。这些重复序列在不同物种中表现出不同的分布特征,例如 *E. pubescens* 的线粒体基因组中,某些染色体上的分散重复序列含量较高,可能与基因组的重组能力有关。分散重复序列的存在可能影响基因组的结构稳定性,并为基因组的进化提供潜在的机制支持。

### 5. 线粒体与叶绿体基因组的同源关系

线粒体基因组与叶绿体基因组之间存在一定的同源关系,部分叶绿体基因可能通过水平基因转移(horizontal gene transfer, HGT)进入线粒体基因组。在本研究中,三种 *Epimedium* 线粒体基因组中均检测到来自叶绿体的同源片段(MTPTs),这些片段包含多个完整的基因,如 *petG*、*rps7* 和 *ndhB*。这些基因的转移可能有助于维持线粒体翻译过程中所需的某些功能,例如氨基酸的转移。MTPTs 的存在表明,线粒体和叶绿体基因组之间可能存在一定程度的基因交流,这种现象在植物进化过程中具有重要意义。

通过 BLASTN 分析,研究团队发现了三种 *Epimedium* 线粒体基因组与叶绿体基因组之间的同源区域。这些同源区域在基因组结构上表现出一定的保守性,但同时也存在基因排列顺序的变化,反映了线粒体基因组在进化过程中的动态性。进一步的比较分析表明,线粒体基因组的同源区域可能受到多种因素的影响,包括基因组重组、基因复制以及物种间的进化差异。

### 6. 基因组的共线性分析与进化模式

为了探讨 *Epimedium* 线粒体基因组的进化保守性,研究团队进行了共线性分析。通过 MCScanX 工具,比较了三种 *Epimedium* 线粒体基因组与其他植物物种(如 *Paropyrum anemonoides*、*C. omeiensis*、*Stephania japonica* 和 *C. pauciovulata*)之间的基因排列顺序。结果表明,*Epimedium* 线粒体基因组在某些区域表现出高度的共线性,如 *E. pubescens* 的染色体 4 与 *E. sagittatum* 和 *E. wushanense* 的线粒体基因组在结构上存在显著相似性,这可能意味着这些区域在进化过程中保持相对稳定。然而,许多共线性区域长度较短,且在不同物种间存在缺失,表明线粒体基因组的结构可能存在较大的变异。

此外,研究还检测到了多个倒置区域,这进一步表明线粒体基因组的结构在不同物种间存在显著的基因排列变化。这些变化可能与基因组的进化压力有关,例如基因组重组或基因复制事件。通过比较不同物种的共线性模式,研究团队发现线粒体基因组的进化可能受到多种因素的影响,包括基因组结构的动态变化和物种间的分化过程。

### 7. 系统发育分析与分类学意义

基于 29 个保守的蛋白质编码基因(PCGs),研究团队构建了一个最大似然(ML)系统发育树,以揭示 *Epimedium* 与其他植物类群的进化关系。该系统发育树包含 26 个物种,涵盖三个目(Ranunculales、Proteales 和 Magnoliales),并以 *Liriodendron tulipifera* 和 *Magnolia liliiflora* 作为外群。结果显示,三种 *Epimedium* 物种在系统发育树上形成了一个单系群,且 *E. sagittatum* 和 *E. pubescens* 的亲缘关系较为紧密,与 *E. wushanense* 构成了姐妹群。这一结果支持了 *Epimedium* 属的系统发育关系,并为该属的分类提供了新的依据。

值得注意的是,该系统发育树的构建结果与最新的被子植物分类系统(APG IV)基本一致,表明线粒体基因组在系统发育分析中具有较高的可靠性。此外,系统发育树的拓扑结构较为清晰,能够有效区分 *Epimedium* 与其他类群的物种。这一发现不仅加深了我们对 *Epimedium* 属系统发育的理解,还为该属的分类学研究提供了新的视角。

### 8. 线粒体基因组的进化与功能意义

线粒体基因组的进化不仅受到基因组结构变化的影响,还可能与基因编辑、重复序列和水平基因转移等机制密切相关。本研究中发现的大量 RNA 编辑位点和重复序列表明,线粒体基因组在功能和结构上具有高度的动态性。这些特性可能有助于植物适应不同的环境条件,并在进化过程中形成新的基因表达模式。

此外,线粒体基因组的进化速率较低,这使得其在系统发育分析中具有较高的保守性。然而,这种保守性并不意味着线粒体基因组完全不变,相反,它可能通过结构变化和基因编辑来实现功能上的多样性。例如,*E. sagittatum* 和 *E. pubescens* 的线粒体基因组中检测到了多个不同的编辑位点,这可能与它们的适应性特征有关。

### 9. 研究的局限性与未来方向

尽管本研究取得了重要进展,但仍存在一些局限性。首先,目前仅对三种 *Epimedium* 物种进行了线粒体基因组的解析,而该属包含 68 个物种,未来需要对更多物种进行研究,以全面揭示其线粒体基因组的多样性。其次,线粒体基因组的重复序列和 RNA 编辑事件的具体功能仍需进一步探讨,尤其是在基因表达调控和进化适应中的作用。此外,虽然本研究揭示了线粒体基因组与叶绿体基因组之间的同源关系,但这一现象在不同物种中的具体机制仍有待深入研究。

最后,本研究不仅为 *Epimedium* 属的分类学和进化研究提供了新的数据支持,还为未来线粒体基因组在植物系统发育和功能研究中的应用奠定了基础。随着基因组学技术的不断发展,线粒体基因组有望成为植物分类和进化研究的重要工具。

生物通微信公众号
微信
新浪微博


生物通 版权所有