基于计算变异效应预测评估药物基因组学单倍型功能与抗抑郁药物严重不良反应风险

时间:2026年3月11日
来源:The Pharmacogenomics Journal

编辑推荐:

为解决药物基因组学中“星等位体”框架无法评估新发罕见变异、难以扩展至复杂单倍型等局限,研究人员开发并综合评估了多款通用(如CADD)与新型专用(如PharmGScore)计算预测工具,证明其评估药物代谢相关基因(如CYP2C19)变异功能的有效性,并成功用于预测抗抑郁药物严重不良反应风险。这项研究为利用全基因组测序数据进行全面的药物基因组学解读提供了可扩展的计算解决方案。

广告
   X   

精准医疗(Precision Medicine)致力于将基因组学信息与临床治疗相结合,为个体“量身定制”用药方案,以提升疗效、减少副作用。但在精神疾病等治疗领域,实现这一目标仍然充满挑战。据统计,高达20-60%的患者对一线抗抑郁药物(antidepressant)治疗无反应。药物基因组学(Pharmacogenomics, PGx)被认为是解决这一难题的关键,它旨在通过分析个体的遗传变异来预测其对特定药物的反应。目前,临床实践中主要依赖“星等位体”(star allele)系统来解读关键的药物代谢酶基因(如CYP2C19)。然而,这个框架就像一本预先编好的、有限的药品目录:它只包含已知的常见变异“组合”(即单倍型),并将功能简单分为“正常”、“降低”、“无功能”和“增加功能”四类。当测序技术发现一个从未被收录的、或结构复杂的罕见变异时,这本“目录”就显得无能为力了。此外,超过90%的药物基因组学变异是罕见的,且约17%的CYP(Cytochrome P450,细胞色素P450)酶功能多样性无法用已知变异解释。这意味着,大量患者的遗传信息无法得到有效解读,潜在的用药风险被隐藏。
计算生物学的发展为解决这个问题提供了新思路。一系列计算工具,如CADD、SIFT等,已被开发用于评估基因组变异的有害性。但这些通用工具在评估药物代谢相关基因时常常表现不佳。为此,研究人员开发了APF、APF2等专用于药物基因组学的预测模型,但它们大多评估单个变异,难以处理由多个变异构成的完整单倍型,也尚未在大型人群真实临床数据中与传统的“星等位体”预测进行直接比较。为了填补这一空白,一个国际研究团队在《The Pharmacogenomics Journal》上发表了一项综合研究,他们开发了两种新型评估框架(PharmGScore和PharmMLScore),并对包括通用工具和专用工具在内的十种计算预测工具进行了迄今为止最全面的评估,旨在回答一个核心问题:计算工具能否在解读药物基因组学数据时,达到甚至超越传统“星等位体”框架的准确性和实用性?
为了回答这个问题,研究人员设计了一个多层次、逐步递进的评估策略。首先,他们基于药物基因变异数据库(PharmVar)中8个关键药物基因(包括CYP2B6CYP2C19CYP2C9CYP2D6DPYDNUDT15SLCO1B1CYP3A5)的541个“星等位体”定义,评估计算工具在区分不同功能单倍型方面的表现。其次,为了检验工具对新发、未知变异(而非仅训练集中已有的变异)的预测能力,他们利用了对CYP2C9CYP2C19基因进行的深度突变扫描(Deep Mutational Scanning, DMS)高通量功能数据,这些数据包含了数千个人工构建的、大部分在自然人群中罕见的错义、同义和无义变异。第三,他们利用英国生物银行(UK Biobank, UKB)中20余万例与健康记录相关联的全外显子组测序(Whole-Exome Sequencing, WES)数据,在人群层面验证计算工具的预测结果是否与“星等位体”分型结果一致。最后,也是最具临床意义的一步,他们将计算工具应用于UKB的临床结局数据,分析携带由计算工具预测的CYP2C19功能缺失变异的个体,是否与“星等位体”定义的弱代谢者(Poor Metabolizer)一样,面临更高的抗抑郁药物(如西酞普兰、舍曲林等)严重不良反应(Adverse Drug Reaction, ADR)风险。在方法学上,除了评估现有工具,本研究还构建了PharmGScore和PharmMLScore两个新框架。PharmGScore整合了CADD、FATHMM-XF、Mutation Assessor和PROVEAN四个互补性预测因子的信息,提供了一个覆盖编码区及附近(外显子±60碱基对内)所有单核苷酸变异(SNV)的连续评分。PharmMLScore则采用了一个前馈神经网络(Feed-Forward Neural Network),以整个单倍型的变异评分总和等作为特征,来预测其功能类别。所有的评估都采用了受试者工作特征曲线下面积(AUC)、真阳性率(TPR)和比值比(OR)等统计指标,并对不同工具在各项任务中的表现进行了系统比较。
评估工具在预测“星等位体”功能方面的表现
在基于PharmVar数据库的评估中,研究人员测试了十种计算工具区分正常/增加功能与降低/无功能“星等位体”的能力。结果发现,新型框架PharmGScore表现最佳,其AUC值达到0.849,超过了APF2(0.817)和APF(0.801)等专用工具。在成对比较中,区分正常功能与无功能等位体最为有效,而区分增加功能与正常功能等位体则最具挑战性。研究还指出,通用的有害性阈值并不适用,预测效果和最佳阈值因基因和工具而异。例如,CYP2C9所需的“有害”判定阈值低于CYP2B6CYP2D6。总体而言,集成评分框架(如PharmGScore、APF2)的表现优于单一预测因子,在基因水平的功能区分中正确率更高。
评估工具在预测新发变异体外功能方面的表现
为了检验工具独立于已知训练数据评估新发变异的能力,研究人员使用了CYP2C9CYP2C19的深度突变扫描数据。这些数据包含了大量在自然群体中几乎从未被观测到的变异,是评估工具泛化能力的理想测试集。结果显示,所有工具在分类高活性(评分>0.8)与低活性(评分<0.2)变异方面都表现出色。其中,CADD和药物基因组学专用集成工具(PharmGScore, PharmMLScore, APF, APF2)表现尤为突出,AUC值均大于0.90,证明它们能有效识别具有破坏性的新发错义、同义乃至无义变异。此外,与通用工具相比,专用工具在进化保守性较低区域的变异评估中表现出优势,这对于评估受纯化选择压力较小的药物代谢基因变异具有重要意义。
在人群外显子组数据中验证计算预测
研究人员利用UKB的20余万例WES数据,评估了计算工具预测结果与基于“星等位体”分型得出的代谢表型(如正常代谢者、弱代谢者)之间的对应关系。结果显示,计算工具的预测能够在人群层面上较好地重现“星等位体”的表型分类。对于无功能等位体,预测的平均真阳性率达到0.61。在具体基因上,PharmMLScore和PharmGScore在CYP2C19基因上表现出最高的灵敏度,分别达到0.81和0.78。研究也发现了WES数据的局限性,例如无法检测到位于基因间区的CYP2C19*17增加功能多态性。但研究指出,WES捕获了绝大多数药物基因组学变异,仍是当前临床测序数据的主要形式,基于此的评估具有重要现实意义。
计算工具预测抗抑郁药物严重不良反应
这是本研究的临床转化应用核心。研究人员分析了UKB中服用抗抑郁药物患者的健康记录,重点考察了携带由计算工具或“星等位体”定义的CYP2C19功能缺失变异的个体,其发生严重ADR(通过医院诊断码T43.0-T43.2和Y49.0-Y49.2识别)的风险是否更高。结果显示,无论是基于传统“星等位体”定义,还是基于PharmGScore或PharmMLScore的预测,携带CYP2C19功能缺失变异均会显著增加抗抑郁药物中毒的风险,其比值比分别为1.20、1.24和1.23。CADD的预测也显示出相似的关联趋势(OR=1.34)。在十种评估工具中,有九种预测的功能缺失携带者发生严重ADR的比值比大于1。当将分析限制在无自残记录的“意外中毒”病例时,“星等位体”、PharmGScore和PharmMLScore的比值比估计值依然相近且稳定,进一步支持了计算工具在风险评估中的潜在价值。在预测“治疗转换”(作

生物通微信公众号
微信
新浪微博


生物通 版权所有