苹果单倍型基因组:19个栽培品种的单倍型解析染色体级别基因组组装揭示遗传多样性新维度

时间:2026年1月26日
来源:Scientific Data

编辑推荐:

本研究针对苹果高杂合性基因组组装难题,研究人员利用PacBio HiFi长读长测序技术对19个苹果栽培品种进行全基因组测序,成功构建了38个单倍型基因组(haplome),平均组装大小675.3 Mb,包含47,445个注释基因,BUSCO完整性达98.8%。研究发现了578个新型orthogroups,为苹果基因组学研究提供了高质量资源,将显著促进全基因组关联分析(GWAS)和育种改良。

广告
   X   

苹果作为全球第三大经济水果作物,其遗传改良一直受到基因组高度杂合性的制约。传统的基因组组装方法难以准确解析苹果的双等位基因信息,而利用纯合材料进行的组装又只能捕获单一单倍型,无法全面反映物种的真实遗传多样性。随着长读长测序技术的发展,单倍型解析基因组组装为这一难题提供了新的解决方案。
研究人员在《Scientific Data》上发表了19个苹果栽培品种的单倍型解析染色体级别基因组组装。这些品种选自REFPOP群体,涵盖表型极端个体、遗传多样性代表种以及具有历史或商业价值的重要栽培品种。通过PacBio Revio系统产生30倍覆盖度的HiFi长读长数据,利用Hifiasm v0.19.8进行组装,并基于HFTH1 v1.0参考基因组使用RagTag进行染色体挂载。
研究团队采用多种生物信息学方法对组装质量进行评估:使用BUSCO v5.1.2评估基因组完整性;通过orthogroup分析比较新组装与已有参考基因组的基因含量差异;利用基于20K SNP芯片的遗传图谱数据验证单倍型分型质量。
基因组组装质量
38个单倍型基因组的平均大小为648.97 Mb,N90指标显示大多数组装达到染色体水平。BUSCO完整性评分平均为98.8%,其中单拷贝基因占62.0%,重复基因占31.0%,符合苹果近期经历全基因组复制的特征。唯一例外是'Braeburn'品种的单倍型2组装完整性较低,仅81%的SNP能被定位。
基因注释与比较基因组学
每个单倍型平均注释得到47,445个蛋白质编码基因,显著多于纯合参考基因组GDDH13 v1.1(42,140个)和HFTH1 v1.0(39,617个)。orthogroup分析共鉴定60,012个基因家族,其中13,985个为所有组装共享,8,647个为单拷贝家族。特别重要的是发现了578个在GDDH13 v1.1和HFTH1 v1.0中均不存在但在所有新组装中存在的orthogroups,表明这些组装捕获了新的遗传多样性。
单倍型分型质量
对14个有配套SNP芯片数据的品种进行分析显示,每个染色体平均发生3-4次相位切换,表明单倍型分型连续性良好。'Braeburn'由于测序覆盖度较低而分型质量稍差,而'Giambun'等5个品种因缺乏可靠的系谱分型参考数据而未参与评估。
该研究产生的19个染色体级别单倍型解析基因组为苹果功能基因组学研究提供了重要资源,能够支持全基因组关联分析、重要农艺性状基因挖掘以及苹果驯化历史研究。这些数据特别有助于解析复杂性状的等位基因特异性表达,推动苹果分子育种进入新阶段。所有原始数据和组装结果已保存在NCBI数据库(BioProject PRJNA1168485),供全球研究人员使用。

生物通微信公众号
微信
新浪微博


生物通 版权所有