大规模外显子组分析揭示罕见变异在肌萎缩侧索硬化中的新遗传贡献

时间:2026年4月1日
来源:Nature Genetics

编辑推荐:

为阐明肌萎缩侧索硬化(ALS)的罕见变异遗传风险,研究者整合分析了迄今最大的ALS外显子组测序队列,通过单变异与超罕见变异负担分析,发现了多个新的风险基因(如YKT6),并为既往证据有限的基因(如ARPP21、DNAJC7、CFAP410)提供了独立验证。该研究不仅扩展了对ALS遗传架构的理解,支持寡基因累积风险模型,还为转化研究提供了新靶点。

广告
   X   

肌萎缩侧索硬化(ALS)是一种致命的神经退行性疾病,患者运动神经元进行性退化,导致肌肉萎缩、瘫痪,最终因呼吸衰竭死亡。尽管ALS的病因复杂,但遗传因素在其中扮演着重要角色。过去几十年,科学家们通过家族性病例和全基因组关联研究(GWAS)已经鉴定出数个关键基因,如SOD1、TARDBP、FUS和C9orf72等。然而,这些发现仅能解释约11.6%的ALS病例,这意味着大部分患者的遗传病因仍然未知。越来越多的证据表明,大量遗传风险可能由携带率低、外显率中等的罕见变异所介导。识别这些罕见的“遗传拼图”碎片,对于全面理解疾病机制、开发精准疗法至关重要,正如靶向SOD1基因的反义寡核苷酸(ASO)药物Tofersen的成功所预示的那样。然而,挑战在于,要捕捉这些罕见变异,需要前所未有的大规模、高质量的基因测序数据以及能够处理“低频信号”的强大分析工具。为了填补这一空白,一项汇集全球22个研究队列、近1.8万例ALS患者和20万对照样本的大型国际合作研究应运而生,其成果发表在顶级遗传学期刊《Nature Genetics》上。
本研究主要应用了几个关键技术方法。首先是构建了迄今最大的、经严格质控和统一流程处理的ALS外显子组测序数据集,包含发现队列(13,138例患者,69,775例对照)和独立复制队列(4,781例患者,130,928例对照)。样本主要来自Project MinE、NYGC ALS联盟、ALS测序联盟、英国生物银行等多个国际队列。其次,采用了统一的重比对和联合变异检测流程,将数据统一到GRCh38参考基因组,最大限度减少了技术偏倚。在此基础上,研究人员进行了全面的单变异关联分析和超罕见变异(URV)负担分析,使用Firth逻辑回归处理罕见变异分析中的不平衡问题,并采用ACAT(Adaptive Combination of Association Tests)方法整合不同过滤策略下的检验结果,以识别新的风险基因、变异和通路。
结果部分的主要发现如下:
构建用于罕见变异分析的统一ALS外显子组数据集
为了识别与ALS相关的罕见编码变异,研究者将18个全外显子组(WXS)和全基因组(WGS)测序数据集整合成一个包含94,545人的发现队列。所有数据均统一重比对至GRCh38参考基因组,并进行联合变异检测,显著降低了技术变异。经过严格过滤,最终数据集包含13,138例无亲缘关系的患者和69,775例对照,主要为欧洲裔,涵盖5,207,138个变异。
罕见单变异分析发现五个新风险变异并基本再现已知的ALS罕见变异结构
研究者对272,925个位于可检测次要等位基因频率(MAF)范围内的罕见变异进行了单变异分析。分析发现了15个达到全外显子组显著性的变异,涉及11个不同的基因。其中10个位于已知的ALS相关基因(如SOD1、CFAP410、NEK1、KIF5A、FUS、TBK1),另外5个是首次在ALS中报道的新风险变异。这些新变异包括:中等频率、效应值适中的HTR3C p.T186A和YKT6 p.Y64C;以及罕见但效应值极高的GBGT1 p.R152L、CAPN2 p.I530V和KNTC1 p.W287R。此外,针对ALS基因审阅专家组(GCEP)整理的51个ALS相关基因进行的靶向分析,发现了8个额外变异,包括在目前证据有限的基因ARPP21中发现了两个罕见变异(p.P563L和p.P747L),并提供了独立证据。
超罕见负担分析识别新的ALS相关基因
为了检测在5个或更少携带者中出现的超罕见变异(URV)的累积效应,研究者进行了基因负担检验。分析在17,324个蛋白质编码基因中识别出8个达到全外显子组显著性的基因。其中包括4个已确立的ALS基因(SOD1、TBK1、NEK1、TARDBP),以及目前被归类为证据有限的DNAJC7,该基因首次在外显子组水平的发现分析中达到全基因组显著性。新的候选基因包括TTC3、UNC13C和KIF4A。在蛋白结构域水平的分析中,识别出TBK1、SOD1和VCP中的特定结构域与ALS显著相关。
评估基因集负担和变异共现
基因集负担分析显示,与“RNA剪接调控”和“通过剪接体进行的mRNA剪接调控”相关的基因集显著富集。研究者还检验了携带多个GCEP分类为“明确(Definitive)”的ALS基因中的变异是否会带来累积风险。结果发现,随着个体携带1个、2个、3个或4个符合条件的变异,其患病风险比值比(OR)呈渐进式增加,支持了一种累加的寡基因风险模型。对特定变异对的协同效应分析未发现显著的非加性相互作用。
ARPP21 p.P563L与更早发病和更短病程相关
生存期和发病年龄分析评估了遗传变异对疾病进展的影响。已知变异如SOD1 p.A5V、p.D91A和FUS p.R521C、p.P525L显示出与先前报告一致的效应。值得注意的是,ARPP21 p.P563L变异与显著更低的发病年龄和更短的生存期相关,其效应大小与SOD1 p.A5V相当。
复制分析确认YKT6并支持HTR3C、GBGT1和KNTC1为ALS风险基因
在独立的复制队列中,对发现阶段识别出的五个新单变异进行验证。所有五个变异在复制队列中均显示出效应方向的一致性,并且在发现与复制数据的合并荟萃分析中均达到全外显子组显著性。其中,YKT6 p.Y64C达到了复制范围内的显著性。在三个URV候选基因中,仅KIF4A显示出一致的效应方向,但无一达到复制范围内的显著性。
为ARPP21、DNAJC7和CFAP410建立独立证据
对于在发现分析中显著、但目前被GCEP归类为“证据有限(Limited)”的基因,研究者旨在确认其发现的独立性。对于ARPP21,在排除可能重叠的样本后,p.P563L变异的关联性仍然存在,并在复制数据集中得到进一步支持。对于CFAP410 p.V58L,在排除与原始GWAS队列重复或有亲缘关系的参与者后,关联性仍然高度显著。对于DNAJC7,在排除重叠队列后,在缩减的发现数据集中仍存在稳健的关联,并在复制队列中得到支持。
讨论与结论
这项研究代表了迄今最大规模的ALS罕见变异分析之一,几乎捕获了所有已知的ALS罕见变异遗传结构。研究扩展了已知的ALS遗传因素,证明与同等规模的常见变异GWAS相比,罕见变异分析的产出显著更高。研究结果为ALS提供了更广阔的遗传架构视图:所识别的变异大多是错义突变,其效应值涵盖从具有中等效应大小的低频变异,到能产生巨大效应的超罕见变异。数据支持一种累加的、寡基因风险模型,即多个罕见变异在不产生强相互作用的情况下,累积增加了ALS风险。
在新发现的罕见变异中,YKT6 p.Y64C因其在发现和复制队列中高度显著且一致的关联而突出。YKT6编码一种高度保守的SNARE蛋白,在囊泡运输和自噬体-溶酶体融合中起关键作用。此外,KNTC1、HTR3C和GBGT1中的三个高效应急义变异也是强有力的候选基因。除了这些新发现,本研究的一个关键贡献是为几个先前证据有限的基因提供了强有力的独立证据。在ARPP21中,研究者发现了两个高效应急义变异(p.P563L, p.P747L),其比值比与高外显率变异(如FUS p.R521C和TARDBP p.N352S)相当。ARPP21与TDP-43和FUS一样,是一种在应激下定位至应激颗粒的RNA结合蛋白。在DNAJC7和CFAP410中,研究也分别提供了独立的验证,确认了它们与ALS的关联。
这些发现具有明确的转化潜力。反义寡核苷酸(ASO)疗法(如针对SOD1的Tofersen和针对FUS的Jacifusen)证明了基因靶向治疗的可行性。本研究将可识别遗传风险因素的病例比例从11.6%(“明确”基因)提高到了15.6%(新增已验证的新单变异),若包含C9orf72重复扩增,这一数字则上升至22.9%。虽然并非所有已识别的基因都能成为可行的ASO靶点,但携带高比值比变异的基因(如ARPP21)代表了未来ASO基础研究的优先候选目标。
当然,研究也存在一定局限性,包括未对识别的变异进行功能验证、设计上排除了对非编码变异的研究、主要参与者为欧洲裔、以及少数已知ALS基因(如主要与重复扩增相关的ATXN2和C9orf72)未被检测到等。
总之,通过整合迄今最大的ALS外显子组测序数据集,并结合稳健的统一流程与复制验证,本研究成功揭示了罕见变异对ALS的遗传贡献。研究表明,与常见变异GWAS相比,罕见变异分析在ALS研究中能产生更高的回报。多个新基因的识别,以及对先前证据有限基因的确认,共同为转化性ALS研究提供了一组令人信服的潜在新靶点。

生物通微信公众号
微信
新浪微博


生物通 版权所有