引言: Distylium chinense是一种耐淹的木本物种,分布于长江流域三峡水库的水文波动区,在区域生态恢复中发挥着重要作用。然而,其线粒体基因组(Mitogenome)尚未得到表征。
方法: 本研究采用整合了MGISEQ-2000和Nanopore平台的混合测序策略,对D. chinense的完整线粒体基因组进行了从头组装(De novo)。基于相对同义密码子使用(RSCU)评估了密码子使用偏好。还鉴定了简单序列重复(SSRs)、线粒体质体DNA(MTPTs)片段和RNA编辑位点。
结果: 组装得到的线粒体基因组长度为916,504 bp,GC含量为46.17%,包含39个独特的蛋白质编码基因(PCGs)、19个转运RNA(tRNA)基因和3个核糖体RNA(rRNA)基因。在该线粒体基因组中共检测到294个SSRs、17个MTPTs片段和676个RNA编辑位点。系统发育分析将D. chinense置于虎耳草目(Saxifragales)内,显示与Distylium racemosum的亲缘关系最近。
讨论: 总的来说,这些结果全面表征了D. chinense的线粒体基因组,为未来研究线粒体基因组进化及耐淹性的分子基础建立了宝贵的基因组资源。
研究背景与目的
洪水是由自然过程(如强降雨、融雪)和人类活动(如水电开发改变水文情势)共同导致的广泛非生物胁迫。在三峡水库地区,大坝运行引起的季节性水位波动施加了长期且反复的洪水胁迫,导致植物缺氧、氧化胁迫和代谢失衡。因此,阐明植物的耐淹机制并筛选适宜物种进行生态修复,对于维护生态系统的稳定和保障库区的长期可持续性至关重要。蜡瓣花属物种Distylium chinense是虎耳草目(Saxifragales)金缕梅科(Hamamelidaceae)的一种常绿灌木,天然分布于三峡水库消落带。该物种表现出显著的耐淹性,主要归因于其发达且相互交织的根系,使其能在淹没长达六个月的环境中存活。因此,D. chinense 已被广泛认为是河岸植被恢复、土壤固持和护岸的关键物种,并具有观赏价值。然而,三峡大坝的建设和运行导致其栖息地被大面积淹没,加之过度采伐等人为干扰,其天然种群规模和遗传多样性已严重下降。尽管其生态重要性突出,但关于其耐淹性的分子基础仍然知之甚少。线粒体(Mitochondria)是负责细胞能量代谢的重要细胞器,在植物生长、发育和胁迫响应中发挥核心作用。植物线粒体基因组(Mitogenome)具有尺寸变异大、结构复杂、基因含量保守、非编码区广泛以及频繁发生RNA编辑事件等特点。尽管叶绿体(Plastid)基因组数据迅速积累,但植物线粒体基因组的报道仍然有限。本研究的目的是:1)对D. chinense 的线粒体基因组结构与序列分歧进行全面分析;2)检测其叶绿体与线粒体之间的基因转移事件;3)探究该物种的细胞器基因组进化及与其耐淹性相关的分子机制。本研究为未来深入探究D. chinense 的耐淹分子机制、群体遗传学和进化生物学提供了重要的基因组资源。该论文发表在《Frontiers in Plant Science》期刊。
主要技术方法概述
本研究采用了整合短读长(MGISEQ-2000)和长读长(Nanopore)测序平台的混合测序策略,对采自西南大学温室(中国重庆)的D. chinense 新鲜叶片样本的总DNA进行了全基因组测序。线粒体基因组的组装与注释采用了基于Flye软件进行从头组装、利用同源比对筛选线粒体序列、并参考近缘物种D. racemosum 的线粒体基因组进行比对和手动校正的流程。后续分析包括:使用MEGA软件计算相对同义密码子使用(RSCU)以评估密码子使用偏好;利用MISA、TRF和RepeatMasker等工具分别鉴定简单序列重复(SSRs)、串联重复和分散重复序列;通过比较线粒体与叶绿体基因组序列,使用BLASTn识别同源片段(即MTPTs);利用Deepred-mt工具预测线粒体蛋白质编码基因(PCGs)中的C-to-U RNA编辑位点。最后,通过提取34个物种共有的17个核心PCGs,使用MAFFT进行多重序列比对,并利用IQ-TREE构建最大似然(ML)系统发育树,以明确D. chinense 的系统发育位置。
研究结果
3.1 D. chinense 线粒体基因组的基本特征
研究人员组装获得了D. chinense 的完整线粒体基因组。该基因组结构高度复杂,呈多分支、多染色体构型,由6个相互连接的contigs组成。基因组总长度为916,504 bp,GC含量为46.17%。共注释到39个独特的蛋白质编码基因(PCGs),包括24个核心基因和15个非核心基因,以及19个转运RNA(tRNA)基因(其中8个为多拷贝)和3个核糖体RNA(rRNA)基因。核心基因包括编码ATP合成酶(atp1, atp4, atp6, atp8, atp9)、NADH脱氢酶(nad1, nad2, nad3, nad4, nad4L, nad5, nad6, nad7, nad9)、细胞色素C生物合成(ccmB, ccmC, ccmFC, ccmFN)、细胞色素C氧化酶(cox1, cox2, cox3)的亚基,以及编码细胞色素b(cob)、膜转运蛋白(mttB)和成熟酶(matR)的基因。非核心基因则包括核糖体大亚基(rpl2, rpl5, rpl10, rpl16)和小亚基(rps1, rps3, rps4, rps7, rps10, rps12, rps13, rps14, rps19)基因,以及琥珀酸脱氢酶基因(sdh3, sdh4)。相关图谱可参考图1。
3.2 PCGs的密码子使用分析
研究人员对D. chinense 线粒体基因组中所有PCGs的密码子使用偏好进行了系统分析。结果显示,其线粒体基因组密码子使用存在明显偏好。起始密码子AUG和色氨酸(Trp, UGG)密码子无偏好性。在所有密码子中,丙氨酸(Ala)对密码子GCU表现出最强的偏好性,其RSCU值最高(1.59),表明D. chinense 线粒体基因组存在显著的密码子使用偏好。详细数据见图2。
3.3 重复序列和重组事件研究
在D. chinense 线粒体基因组中共鉴定出294个简单序列重复(SSRs),其中四聚体重复基序最为丰富,占41.84%。在75个单体重复中,胸腺嘧啶(T)重复占主导(52.00%,共39个)。此外,还鉴定了54个串联重复和1054个长度超过30 bp的分散重复对(包括520个回文重复和534个正向重复)。SSRs在染色体1和染色体2上的分布情况见图3。
3.4 RNA编辑事件
研究人员预测了D. chinense 线粒体基因组中的RNA编辑事件。在所有39个PCGs中,共预测到676个RNA编辑位点,全部为胞苷(C)到尿苷(U)的转换。nad4基因编辑位点最多(47个),其次是ccmB基因(42个),见图4A。这些编辑事件导致了同义和非同义替换。非同义替换中最常见的是丝氨酸(Ser)转变为亮氨酸(Leu)和苯丙氨酸(Phe),见图4B。尤为重要的是,在11个基因中观察到了由编辑事件创建起始密码子或终止密码子的情况,这影响了相关蛋白质的合成。
3.5 系统发育与同线性分析
为了探究D. chinense 的进化地位,研究人员基于34个物种(分属虎耳草目Saxifragales、檀香目Santalales和山龙眼目Proteales)共享的17个保守核心PCGs的核苷酸序列构建了系统发育树。莲(Nelumbo nucifera)和澳洲坚果(Macadamia integrifolia)被选为外类群。基于线粒体DNA序列的系统发育结构与最新的被子植物分类系统基本一致。在进化树中,D. chinense 位于虎耳草目内,并显示出与Distylium racemosum最亲近的进化关系,见图5。同线性分析显示,D. chinense 与D. racemosum 之间存在大量的同线性区块,表明两者在基因组结构上具有较高的保守性,见图7。
3.6 MTPTs的特征分析
通过序列相似性分析,在D. chinense 的线粒体基因组和叶绿体基因组之间共鉴定出17个同源片段(MTPTs),累计长度为11,981 bp,占完整线粒体基因组的1.31%。其中,MTPT5片段最长(6,466 bp)。通过注释,在这些同源片段中进一步识别出15个完整的基因,包括9个蛋白质编码基因(ndhJ, petG, petL, psbE, psbF, psbJ, psbL, rpl20, rpoC1)和6个tRNA基因(trnH-GUG, trnI-CAU, trnM-CAU, trnN-GUU, trnP-UGG, trnW-CCA),见图6。
讨论与总结
在讨论部分,研究人员首先指出了本研究采用的从全基因组测序数据中组装线粒体基因组策略的局限性,即计算资源消耗大且需从大量无关的核基因组序列中筛选线粒体序列,过程繁琐且易错,建议未来开发专用算法用于长读长的初步筛选。重复序列在植物基因组中广泛存在,对基因组大小进化、基因表达调控和胁迫响应有重要作用。本研究发现的大量SSRs和分散重复序列,为评估种质多样性和物种鉴定提供了有价值的标记资源,尽管它们的确切功能尚不清楚。线粒体质体DNA(MTPTs)是质体基因水平转移到线粒体基因组的片段。本研究在D. chinense 中发现了17个MTPT片段,包含9个PCGs和6个tRNA基因,这些转移基因是否仍有功能是一个开放性问题。密码子使用偏好分析显示,亮氨酸(Leu)、丝氨酸(Ser)和精氨酸(Arg)是D. chinense 线粒体基因组中最主要的氨基酸,这一保守模式与大多数被子植物物种一致,反映了长期进化过程中对线粒体基因翻译效率和能量代谢途径稳定运行的适应性优化。系统发育分析支持D. chinense 位于虎耳草目,并与D. racemosum 亲缘关系最近。比较基因组学分析显示,D. chinense 的线粒体基因组呈现复杂的多分支、多染色体结构,这与D. racemosum 以及茶树(Camellia sinensis cv. 'Zhuyeqi')和盐生植物(Halogeton glomeratus)中的报道类似,表明植物线粒体基因组可能具有比预期更大的结构多样性。尽管D. chinense 与D. racemosum 之间存在大量保守的同线性区块,但也检测到显著的基因组重排,表明物种间存在动态的结构变异。RNA编辑是高等植物线粒体中的普遍现象,可产生起始和终止密码子,从而深刻影响基因表达和蛋白质功能。本研究预测了676个C-to-U编辑位点,其中11个可创建起始或终止密码子,这些编辑事件在植物生长、发育和环境适应中的具体作用仍需进一步探索。
研究结论翻译
综上所述,本研究利用整合MGISEQ-2000和Nanopore平台的混合测序策略,组装了Distylium chinense的完整线粒体基因组。该线粒体基因组呈现复杂的多分支结构,总长度为916,504 bp,包含39个PCGs、19个tRNA基因和3个rRNA基因。在线粒体与叶绿体基因组之间检测到17个同源片段,累计长度为11,981 bp,占线粒体基因组的1.31%。RNA编辑分析表明,蛋白质编码基因中的大多数编辑事件均为胞苷到尿苷的转换。系统发育分析表明D. chinense与D. racemosum亲缘关系密切。总而言之,本研究为D. chinense提供了高质量的线粒体基因组资源,并为未来研究该物种的细胞内基因转移、线粒体基因组进化和功能基因组学奠定了坚实基础。