基于魁北克CARTaGENE队列的多族裔基因组参考图谱构建及其在疾病基因发现与精准医疗中的应用

时间:2026年2月4日
来源:Nature Communications

编辑推荐:

本研究通过分析魁北克CARTaGENE(CaG)队列中29,337名参与者的基因组数据,构建了针对魁北克多族裔人群的遗传参考图谱。研究人员对2,173名参与者进行全基因组测序,揭示了法裔加拿大人(QFC)、海地裔(QHA)和摩洛哥裔(QMO)人群的独特遗传特征。研究发现,使用CaG单倍型参考面板进行基因型填充相比TOPMed面板可多发现约7%的显著关联位点,并鉴定出SPG7基因中与遗传性痉挛性截瘫相关的致病突变。该研究为魁北克人群特异性疾病的遗传基础解析提供了重要资源,对推动精准医疗发展具有重要意义。

广告
   X   

在全球基因组学研究快速发展的背景下,大型人群队列如UK Biobank和FinnGen为疾病遗传机制解析提供了宝贵资源。然而,这些国际队列主要代表特定人群,难以捕捉全球不同人群特有的遗传变异谱系。魁北克作为加拿大人口第二大省,其独特的人口历史造就了特殊的遗传结构——大多数居民可追溯至17-18世纪来自法国的约8500名早期移民,形成了著名的"奠基者效应"。这种遗传背景使得某些罕见遗传病相关变异在魁北克特定地区频率显著增高,而在其他人群中极为罕见。
为系统解析魁北克人群的遗传特征,CARTaGENE(CaG)研究团队开展了这项大规模基因组研究。该研究分析了29,337名CaG参与者的基因组数据,并对2,173名参与者进行高深度全基因组测序(平均覆盖度33.4X),重点关注法裔加拿大人(QFC,1,756名)、海地裔(QHA,163名)和摩洛哥裔(QMO,131名)人群。研究人员通过主成分分析(PCA)和均匀流形近似与投影(UMAP)揭示了魁北克人群的遗传结构,发现第三和第四主成分可区分Charlevoix和Saguenay-Lac-St-Jean(SLSJ)地区的奠基者效应。身份同源(IBD)分析进一步揭示了加斯佩半岛和大西洋省份祖先的参与者群体,可能与阿卡迪亚人群相关。
研究采用了几项关键技术方法:使用Illumina GSA芯片进行全基因组基因分型;DRAGEN流程进行全基因组测序变异检测;SHAPEIT5进行统计定相;Minimac4进行基因型填充;基于WGS数据构建CaG单倍型参考面板;HLA*LA进行HLA分型;TensorQTL进行表达数量性状位点(eQTL)分析。
遗传结构分析
研究发现魁北克人群存在明显的遗传分层。摩洛哥裔参与者(QMO)的祖先成分分析显示北非存在纵向梯度,反映了"回迁非洲"的迁移历史。QMO群体形成两个簇:一个以"阿拉伯"为自我报告种族,另一个以"犹太"为模态自我报告种族,分别对应魁北克历史上记载的两波摩洛哥移民潮。海地裔参与者(QHA)的欧洲血统比例平均为13.3%,非洲血统为86.2%,美洲血统仅0.5%,与先前在佛罗里达州海地出生个体中的研究结果一致。
SPG7基因致病突变分析
研究人员重点分析了与遗传性痉挛性截瘫(HSP)相关的SPG7基因。在CaG队列中,鉴定出9个SPG7致病突变,包括已知的c.1529C>T(p.Ala510Val)和c.988-1G>A突变,以及新发现的c.2293G>A(p.Asp765Asn)和c.376+1G>T剪切突变。祖先重组图(ARG)分析显示,除p.Ala510Val突变(最近共祖时间为96代)外,其他8个突变均在最近15代内具有共同祖先,表明这些突变是由新法兰西早期的单个个体引入的。单倍型共享分析将c.988-1G>A和c.1045G>A突变的起源追溯至17世纪法国Perche地区的同一个奠基者家族。
结构变异与HLA分析
研究鉴定出25,820个结构变异(SV),包括24,022个缺失和1,798个重复。平均每个CaG基因组包含4,118个SV,其中74%与gnomAD-SV数据库中的变异重叠。HLA分型鉴定了307个不同的HLA等位基因,其中HLA-A*24:02:02等位基因在CaG中的频率显著高于全球参考面板,该等位基因与抗癫痫药物皮肤不良反应风险增加相关。
基因型填充性能评估
研究构建了包含2,173个WGS样本的CaG单倍型参考面板,与TOPMed面板相比,CaG面板在填充魁北克人群特异性变异方面表现更优。使用CaG面板进行全基因组关联研究(GWAS)分析了42个定量性状,在欧裔个体中鉴定出378个显著基因座,而TOPMed面板鉴定出356个。Meta填充方法结合两个面板的优势,鉴定出最多的显著基因座(515个)。
研究结论与意义
本研究构建了魁北克多族裔人群的高质量基因组参考资源,揭示了人群特异性遗传变异的分布特征。研究发现,使用当地人群特异的单倍型参考面板可显著提高基因型填充的准确性,特别是对于群体富集的罕见变异。SPG7基因中多个致病突变的鉴定为遗传性痉挛性截瘫的分子诊断提供了重要依据。此外,HLA等位基因和结构变异的全面表征为自身免疫疾病和药物不良反应研究奠定了基础。该资源通过公开的等位基因频率浏览器和GWAS结果数据库向科学界开放,将推动魁北克及全球范围内精准医学研究的发展。
这项研究于2026年发表在《Nature Communications》期刊,不仅填补了魁北克人群基因组资源的空白,也为其他具有独特人口历史的群体基因组研究提供了方法论借鉴。通过整合基因数据与丰富的表型信息和环境暴露数据,CaG队列将继续为复杂疾病遗传架构解析和公共卫生策略制定提供重要支持。

生物通微信公众号
微信
新浪微博


生物通 版权所有