编辑推荐:
研究人员对英国生物银行(UK Biobank)490,640名参与者开展全基因组测序(WGS),构建了迄今最大规模的WGS数据库,鉴定出15亿个遗传变异(包括SNP、indel和结构变异SV),发现非编码区变异占疾病关联信号的89.9%。该研究通过跨祖先meta分析揭示了HBB、G6PD等基因的种群特异性变异模式,并首次系统评估了UTR变异对表型的贡献,为精准医疗提供了关键资源。
人类基因组研究正面临两大挑战:一是现有数据库中非编码区变异信息严重缺失,全外显子测序(WES)仅覆盖2-3%的基因组区域;二是欧洲人群数据占比过高(93.5%),限制了对其他种群特异性变异的认知。英国生物银行(UK Biobank)作为全球最大的人群队列之一,其50万参与者的深度表型数据与基因组信息的结合,为破解这些难题提供了独特机遇。
由Amgen deCODE genetics(冰岛)、AstraZeneca(英国)、GSK(美国)等机构组成的研究联盟,在《Nature》发表了这项里程碑式研究。通过对490,640份样本进行平均32.5×深度的全基因组测序,构建了包含10.37亿SNP、1.01亿indel和192万SV的变异图谱,较传统芯片分型技术多发现18.8倍的遗传变异。
关键技术包括:1) Illumina NovaSeq 6000平台测序;2) DRAGEN v3.7.8和GraphTyper v2.7.5双流程变异检测;3) 基于gnomAD数据的五大人群(AFR/ASJ/EAS/NFE/SAS)分层分析;4) 整合GWAS、罕见变异聚合分析和SV关联研究的多维度统计模型。
数据特征
测序数据覆盖度显著优于WES,在3'UTR区域检出率提升至99.7%(WES仅24.8%)。结构变异分析发现每人平均携带13,102个SV,其中76.3%为频率<0.001%的罕见变异。值得注意的是,非洲裔个体(AFR)的变异数量比欧洲裔(NFE)多出15%。
跨祖先发现
通过多祖先meta-GWAS鉴定28,674个显著关联,其中126个为特定人群独有。典型案例如HBB基因rs334突变(镰状细胞贫血相关)在非洲人群频率达6.26%,而在欧洲仅0.004%;相反,β-地中海贫血相关rs33915217在东南亚人群频率达0.41%。
非编码区突破
首次开展UTR变异全表型关联研究(PheWAS),发现63个显著关联信号。NWD1基因3'UTR变异与肾结石风险相关(P=7.53×10-7),该信号在蛋白编码区分析中未被捕获。
临床转化价值
4.7%个体携带ACMG推荐的临床可操作变异,包括CALR基因52bp缺失(与骨髓纤维化相关)和NEB基因2.5kb缺失( nemaline肌病)。SV分析补充了14.8%的临床相关变异检出率。
这项研究建立了迄今最全面的人类遗传变异图谱,其创新性体现在:1) 揭示非编码区变异对复杂性状的贡献度被严重低估;2) 证明WGS较WES能多发现44倍的携带者(如PKHD1基因变异);3) 为药物靶点验证提供新思路——FOXE3基因罕见移码突变与白内障的关联(OR=8.08)提示该通路可作为治疗靶点。该资源将推动从群体遗传学到个性化医疗的范式转变。
生物通 版权所有