"铂金级家系图谱:长读长测序技术下遗传变异的黄金标准"

时间:2025年8月5日
来源:Nature Methods

编辑推荐:

为解决复杂基因组区域变异检测缺乏全面评估标准的问题,研究人员通过CEPH-1463家系样本,整合PacBio HiFi、Illumina和ONT多平台数据,构建了包含470万SNV、76万indel、53万串联重复(TR)和2.4万结构变异(SV)的GRCh38变异图谱。该研究新增200Mb高置信区域,首次建立NA12878家系的TR/SV基准集,使DeepVariant基因分型错误率降低34%。

广告
   X   

基因组测序技术的最新突破显著提升了复杂区域变异检测能力,但现有标准多聚焦特异性而忽略完整性。这项开创性研究利用经典CEPH-1463家系的孟德尔遗传规律,整合PacBio高保真(HiFi)、Illumina和牛津纳米孔(ONT)三大平台数据,绘制出迄今最全面的遗传变异图谱。该基准集涵盖GRCh38基因组2.77Gb区域,包含4.7×106单核苷酸变异(SNV)、7.68×105插入缺失(indel)、5.37×105串联重复(TR)和2.43×104结构变异(SV),新增200Mb高置信区域,其中8%为以往难以检测的小变异。特别值得注意的是,研究首次建立了NA12878标准品系及其家系的TR和SV黄金标准。作为应用范例,基于该基准集优化的DeepVariant算法,成功将基因分型错误率降低34%,为基因组分析工具开发树立了新标杆。

生物通微信公众号
微信
新浪微博


生物通 版权所有