# 古老柑橘品种基因组解析:解锁宽皮柑橘的进化密码
在水果的世界里,宽皮柑橘(Loose-skin mandarins,LSMs)凭借其易剥皮的特性深受消费者喜爱。中国作为柑橘生产大国,2022 年柑橘产量超 6000 万吨,其中宽皮柑橘占比高达 71%。然而,这一古老的园艺作物却隐藏着诸多未解之谜。其驯化历史模糊不清,复杂的遗传背景、混乱的分类以及化石资源的匮乏,使得人们对其起源和驯化过程争论不休。不同研究虽提出了一些关于其起源的假说,但具体的驯化路径和现代宽皮柑橘之间的遗传联系依旧成谜。
与此同时,在果实性状方面,甜度和大小等重要品质的形成机制也不为人知。甜度作为水果重要的品质指标,在柑橘中由蔗糖、葡萄糖和果糖浓度决定,然而其调控机制却尚未明晰。在柑橘的驯化和改良过程中,虽然已知柚子基因渗入与果实大小存在正相关,但背后的确切原因还未被揭示。这些知识空白严重阻碍了柑橘的遗传改良和新品种培育。
为了揭开宽皮柑橘的神秘面纱,华中农业大学国家园艺作物种质创新与利用重点实验室的研究人员展开了深入探究。他们的研究成果发表在《Genome Biology》杂志上,为我们理解宽皮柑橘的进化历程和果实性状形成机制带来了新的曙光。
研究人员采用了多种先进技术方法来开展此项研究。首先是基因组测序与组装技术,他们选取树龄 120 年的南丰蜜橘(Nanfengmiju tangerine),利用 PacBio HiFi 测序和 Hi-C 技术,成功获得了染色体水平且单倍型解析的高质量基因组。同时,对 77 份广泛种植的宽皮柑橘种质进行重测序,并结合 114 份已发表的柑橘基因组数据进行分析。此外,运用了多种生物信息学分析方法,如构建系统发育树、进行群体结构分析、检测选择信号等,以挖掘基因组中的关键信息。
南丰蜜橘基因组测序、组装与注释
研究人员综合运用多种测序平台对南丰蜜橘基因组进行测序。通过 K-mer 分析估计其基因组大小约为 298.9 Mb,杂合度为 0.935%。利用 HiFi 和 Hi-C 数据组装得到单倍体(Mono)和两个分阶段的单倍型(Hap1 和 Hap2)基因组,其 contig N50 长度均大于 28.1 Mb,相较于之前发表的柑橘基因组有显著提升。经校正和染色体构建,最终得到 9 条假染色体,且三个基因组的 BUSCO 完整性均超 98%,LAI 值超 20,表明基因组具有高完整性和连续性。同时,在基因组中注释到大量重复序列和蛋白质编码基因。
两种单倍型间的基因组变异
对 Hap1 和 Hap2 进行比对分析,发现大量染色体结构变异,包括倒位、易位和重复等,还检测到 2,203,686 个单核苷酸多态性(SNP)、377,400 个插入 / 缺失(InDel)和 1942 个结构变异(SV)。这些变异可能影响基因结构和调控,进而导致等位基因转录调控水平的差异,是南丰蜜橘适应性分化的重要原因。
柑橘亚科物种间的比较基因组分析
通过与 9 种代表性柑橘亚科物种的基因组比较,构建系统发育树。结果显示,宽皮柑橘与其他柑橘亚科物种在约 322 万年前分歧,南丰蜜橘与莽山野橘在约 169 万年前分歧。基因家族分析发现,南丰蜜橘有 151 个特有基因家族,且有 470 个基因家族发生显著扩张,676 个基因家族发生显著收缩,这些基因家族主要富集在苯丙烷生物合成、光合作用等代谢途径。
191 份柑橘种质的群体结构和系统发育分析
研究人员对 77 份中国广泛种植的宽皮柑橘种质进行重测序,并结合已发表数据,共分析 191 份柑橘种质。核苷酸多样性分析表明,宽皮柑橘的遗传多样性高于宜昌橙、枸橼和柚,但低于甜橙和酸橙。通过主成分分析(PCA)、系统发育树构建和 ADMIXTURE 分析,将宽皮柑橘分为 12 个不同群体,揭示了其复杂的群体结构和较高的种内多样性。
宽皮柑橘的起源和驯化历史
研究发现,道县野橘(WM-2)可能是现代栽培宽皮柑橘的最早直接祖先。约 207.6 - 68 万年前,部分古老宽皮柑橘从 WM-2 分化出来,在中布容气候转型期,借助冰川融水扩散到长江流域和珠江流域,形成了长江群体(YZ)和珠江群体(PR)。随后,人工选择加速了柑橘的改良,如南丰蜜橘的不同群体之间存在基因交流,且南丰蜜橘的 NF-2 群体可能是温州蜜柑的亲本。
通过选择扫描分析鉴定潜在的驯化和改良选择区域
研究人员比较 NF-2 和 WM-2、温州蜜柑(SM)和 NF-2 的基因组,分别鉴定出 1100 个驯化选择区域和 863 个改良选择区域。在驯化选择区域中,发现多个参与蔗糖代谢和糖转运的基因,如 CrkSUT4、CrkINVA、CrkSWEET16 等,其中 CrkINVA 在调控柑橘果实糖分含量中起重要作用。在改良选择区域,鉴定出多个参与激素信号转导调控的基因,如 CrkGAI,其对柑橘果实大小有显著负调控作用。
南丰蜜橘果实发育过程中的等位基因表达模式
利用南丰蜜橘完全分阶段的二倍体基因组,研究人员鉴定出 21,031 对等位基因。通过转录组分析发现,果实转录景观主要受全基因组等位基因特异性表达(ASE)影响。在果实发育过程中,检测到 5809 个 ASE 基因,其比例高于其他一些园艺作物。ASE 基因和等位基因等效表达(AEE)基因在不同生物学过程和分子功能上显著富集,且 ASE 基因含有更多遗传变异,这些变异可能是导致 ASE 的重要原因。
在结论与讨论部分,研究人员基于南丰蜜橘的基因组,明确了宽皮柑橘之间的进化关系,发现人工选择 INVA 和 GAI 基因分别改变了果实的甜度和大小。通过构建单倍型解析基因组,提供了南丰蜜橘的等位基因表达图谱。这些研究成果为柑橘的遗传改良提供了宝贵的基因组资源,进一步完善了宽皮柑橘的起源和驯化历史,为培育高品质、适应性强的柑橘新品种提供了理论依据和潜在的育种靶点,在柑橘遗传育种领域具有重要的指导意义。