精准解析错义变异预测工具:临床与科研应用的新进展

时间:2025年3月22日
来源:Human Genetics

编辑推荐:

研究人员评估错义变异效应预测工具,发现新进展及应用差异,助力临床和科研。

广告
   X   

一、研究背景:探索基因变异的未知之旅

在生命科学的神秘世界里,基因变异如同隐藏在 DNA 长链中的神秘密码,它们与人类疾病的关联一直是科学家们努力探索的关键领域。尤其是错义变异(missense variant),这类变异会导致基因编码的蛋白质发生氨基酸改变,其影响从毫无作用到引发疾病不等,在遗传疾病诊断和研究中占据着重要地位。
然而,目前临床测序实验室在解读患者中出现的低频、罕见和新生变异时,常常遭遇困境。由于缺乏足够证据判断这些变异的致病性,许多变异被归类为意义不明的变异(variants of uncertain significance,VUS)。为了攻克这一难题,过去三十年里,众多计算工具应运而生,它们被统称为错义变异效应预测器(missense variant effect predictors),旨在预测错义变异的后果。
但这些工具的预测结果往往存在差异,这给临床和科研工作带来了新的挑战。因此,定期、系统且独立地评估这些工具的性能,对于明确它们在临床和科研中的实用性,以及指导未来改进方向至关重要。在这样的背景下,一项重要的研究拉开了序幕。

二、研究概况:全球科研力量的探索

来自多个国家和机构的研究人员参与了这项研究,相关成果发表在《Human Genetics》杂志上。为了全面评估错义变异效应预测工具的性能,研究人员开展了一系列实验和分析。
研究人员精心构建了一个评估数据集,该数据集包含了来自 ClinVar 和人类基因突变数据库(HGMD)的低频(等位基因频率 < 0.05)错义变异。这些变异被严格筛选,去除了常见变异、具有冲突分类的变异,以及在特定数据库更新前已存在致病性信息的变异等,最终得到了 6,103 个致病性变异和 4,353 个良性变异。
同时,研究人员评估了 60 种错义变异效应预测工具的性能,其中包括 6 个团队提交给 CAGI 6 Annotate-All-Missense 挑战的 12 个模型,临床遗传学领域常用的预测工具,以及近期开发的深度学习方法。

三、研究方法:科学严谨的探索之路

  1. 评估数据集构建:从 ClinVar 和 HGMD 数据库中获取变异数据,利用 SnpEff 软件为变异分配分子效应,并筛选出符合条件的错义变异。通过去除特定数据库中已存在的变异、根据等位基因频率排除可能良性的变异,以及确保变异位于孟德尔疾病基因上等操作,构建出高质量的评估数据集。
  2. 获取预测结果:从多个渠道获取不同预测工具对评估数据集的预测结果。对于 CAGI 6 Annotate-All-Missense 挑战的提交模型,研究人员获取其对特定变异列表的预测分数;对于其他工具,从 dbNSFP 数据库提取预测分数,部分工具的预测分数由原作者提供或通过特定计算获得。

四、研究结果:突破与发现的呈现

  1. 评估数据集:构建的评估数据集包含来自 2,115 个基因的变异,其等位基因频率分布显示致病性变异的频率低于良性变异。这一趋势符合预期,因为有害变异更易受到负选择,在人群中相对罕见12
  2. 错义变异效应预测器:在评估的 60 个预测器中,研究重点展示了 26 个具有代表性的预测器。通过绘制受试者工作特征曲线(Receiver Operating Characteristic curve,ROC 曲线)并计算曲线下面积(Area Under the Curve,AUC),发现 Meta 预测器往往能通过整合个体预测器的分数获得更高的 AUC。例如,明确将等位基因频率作为预测特征的 Meta 预测器 ClinPred 和 MetaRNN,在全评估数据集上的 AUC 可达 0.92;而不明确使用该特征的 VARITY_R,AUC 为 0.88。个体预测器中,AlphaMissense 表现突出,AUC 达到 0.8834
  3. ClinVar 和 HGMD 数据子集:由于 ClinVar 和 HGMD 数据库的整理策略不同,研究人员分别构建了包含来自这两个数据库致病性变异的子集进行分析。结果发现,所有预测器在包含 ClinVar 致病性变异的子集上表现更好,这可能是因为 HGMD 数据库中存在假阳性,也可能反映了两个数据库中变异的可预测性或复杂性存在差异。此外,当研究人员创建一个仅包含 ClinVar 中两颗星及以上(即多个提交者且无冲突)变异的子集时,几乎所有模型的性能都有所提高,但由于该子集规模较小,难以得出关于性能和模型排名的可靠结论56
  4. 高特异性和高敏感性性能:在实际应用中,不同场景对预测器的特异性和敏感性要求不同。研究人员分别考察了预测器在高特异性(假阳性率≤5%)和高敏感性(真阳性率≥95%)区域的性能。结果发现,一些预测器在不同区域的表现差异显著。例如,MetaRNN 在高敏感性区域表现出色,而 MISTIC 在高特异性区域表现良好,这表明不同方法可能更适合不同的临床或科研应用78
  5. 等位基因频率的影响:研究发现,利用等位基因频率作为预测特征的方法在区分极罕见良性变异和致病性变异时存在困难。当对良性变异按等位基因频率进行分组评估时,ClinPred、MetaRNN 和 BayesDel_addAF 这三个使用等位基因频率的顶级预测器,在区分极罕见良性变异时性能明显下降。尽管如此,MetaRNN 和 ClinPred 在区分极罕见良性变异方面仍优于大多数其他预测器。此外,研究人员创建了一个等位基因频率匹配的数据集,发现使用等位基因频率作为预测特征的方法在该数据集上性能下降最为明显910
  6. 基因标签失衡的影响:疾病相关变异数据库中,每个基因的致病性与良性变异比例存在较大失衡。研究人员通过测试一个简单的基线模型发现,这种失衡对预测器性能有影响。创建基因标签平衡的数据集后,许多预测器,尤其是 Meta 预测器,在该数据集上的性能下降。然而,未在致病性或致病标签上训练的预测器,如 AlphaMissense、PrimateAI-3D 等,在基因标签平衡数据集上的性能并未下降1112
  7. 先验致病性概率对证据阈值的影响:研究人员应用一种校准方法,在不同的先验致病性概率下对所有测试预测器进行校准。结果发现,较低的先验致病性概率会导致良性和致病性的证据强度降低。由于等位基因频率对明确使用该特征的工具性能有影响,研究人员建议未来应在每个等位基因频率区间内分别对这些工具进行校准13

五、研究结论与讨论:开启基因变异研究新征程

这项研究全面评估了错义变异效应预测工具在多种评估条件下的性能,为临床和科研应用提供了重要参考。研究表明,许多预测器在评估数据集上表现出强大的性能,虽然 Meta 预测器总体上优于个体预测器,但一些个体预测器的性能与常用 Meta 预测器相近。
研究还发现,不同预测器在高特异性和高敏感性设置下的表现差异,强调了选择合适预测器对于不同临床和科研应用的重要性。同时,研究揭示了等位基因频率和基因标签失衡对预测器性能的影响,为未来改进预测工具提供了方向。
然而,使用临床变异数据库进行评估存在局限性,如可能存在标签错误、训练数据与评估数据重叠以及潜在的循环性等问题。为了持续进行无偏评估,临床变异数据库需要记录每个变异分类的证据来源。
总体而言,目前可用的错义变异效应预测工具为分类意义不明的错义变异提供了有力证据。随着研究的不断推进,这些工具将不断改进,为人类健康事业带来更多福祉。未来,研究人员将继续探索更准确、更可靠的预测方法,进一步揭示基因变异与疾病之间的奥秘。

生物通微信公众号
微信
新浪微博


生物通 版权所有