樱桃,在生活中十分常见,春日里满树繁花,秋季时硕果累累,无论是作为园林观赏植物,还是可食用的水果,都有着极高的价值。然而,对樱桃物种的精准鉴定却困难重重。由于其分布广泛且存在大量重叠,频繁的杂交现象,花朵开放与闭合状态多样,还有花叶不同期的特点,传统的形态学鉴定方法难以准确区分不同的樱桃物种。同时,以往使用的分子标记技术,如 RFLP(限制性片段长度多态性)、RAPD(随机扩增多态性 DNA)等,存在 PCR 扩增率低、测序分辨率差等问题,无法满足精准鉴定的需求。在此背景下,浙江农林大学等研究机构的研究人员开展了深入研究,旨在构建一套精准有效的樱桃物种 DNA 识别系统。这一研究成果发表在《BMC Plant Biology》上,为樱桃产业的发展提供了关键支撑。
在研究过程中,研究人员运用了多种技术方法。首先,采集了 36 个樱桃样本的新鲜叶片,并从 NCBI 数据库获取了 62 个样本数据。然后,利用 mCTAB 协议提取 DNA,通过 Illumina HiSeq X Ten 平台进行测序。接着,使用 NGS-QC toolkit 进行质量控制,运用 SPAdes v.3.6.1 等软件进行叶绿体基因组的组装与注释。最后,借助 MAFFT v7、IQ-TREE 等软件进行序列比对和系统发育分析。
研究结果主要从以下几个方面展开:
- 叶绿体基因组特征:研究分析了 96 个樱桃样本的叶绿体基因组,发现其具有典型的四分体结构。基因组总长度在 157,458bp(Prunus emarginata MN389436)到 158,138bp(P. sargentii MW392082)之间,平均长度为 157,907bp。基因数量在 127 - 141 个之间,平均为 129 个,其中编码序列(CDS)平均有 84 个,rRNA 基因数量高度保守,tRNA 基因平均为 37 个。
- 高变区、SSR 位点和 SNP 位点分布:通过比对分析,确定了 14 个高变区,其 Pi 值大于 0.01,主要分布在基因间隔区。SSR 分析显示,单核苷酸 SSR 占比最多,A 和 T 类型的单核苷酸 SSR 最为常见。Indel 分析发现 36 个物种含有独特的 Indel 结构,插入事件多于缺失事件。51 个物种含有独特的 SNP 位点,不同物种的 SNP 位点数量差异较大。
- 系统发育分析:基于 96 个樱桃样本和 3 个近缘物种的完整叶绿体基因组序列构建系统发育树,结果表明各樱桃物种间的系统发育关系清晰,同一物种的个体聚集在同一分支,部分单一个体代表的物种也展现出足够的变异。
- 精准鉴定分析:使用 14 个高变区构建 ML 系统发育树评估其鉴定能力,单个 DNA 条形码的鉴定成功率在 4.17%(region10)到 34.18%(region14)之间,组合使用时可鉴定 60.42% 的样本,综合来看能精准鉴定 71.88% 的样本。以全叶绿体基因组作为 “超级 DNA 条形码”,能精准鉴定 96.72%(59/61)的樱桃物种。利用特定的 SNP 位点和 Indels,可准确鉴定 59 个物种,与全叶绿体基因组的鉴定准确率相当。
研究结论和讨论部分意义重大。一方面,该研究通过全叶绿体基因组数据详细阐明了樱桃物种间的系统发育关系,解决了以往研究样本代表性不足、分子标记分辨率低的问题。尽管部分结论与传统认知存在差异,但这也进一步揭示了樱桃物种的复杂性。另一方面,成功构建了樱桃物种的快速识别系统,包括传统 DNA 条形码鉴定、基于下一代测序的传统 DNA 条形码鉴定以及利用 SNPs 和结构变异的鉴定方法。这些方法各有优劣,为不同条件下的樱桃物种鉴定提供了多种选择。不过,研究也存在一定局限性,如部分物种仅由单一样本代表,公共数据库数据存在不确定性等。但总体而言,该研究为樱桃物种的精准鉴定提供了有力工具,为樱桃的科学栽培和品种改良奠定了坚实基础,推动了樱桃产业的进一步发展。