AI 驱动的对比学习预测生物标志物发现:革新临床试验成果,引领精准医疗新时代

时间:2025年4月18日
来源:Cancer Cell

编辑推荐:

本文介绍了预测生物标志物建模框架(PBMF),其基于对比学习,能自动、系统且无偏地探索预测生物标志物。研究显示,PBMF 在多种数据场景下优于现有方法,可用于回顾性改进患者选择,为临床决策提供有力支持,助力精准医疗发展。

广告
   X   

背景与挑战

精准医学旨在依据患者个体疾病特征给予精准治疗,预测生物标志物在其中意义重大,它能精准筛选出更可能从特定疗法中获益的患者,对优化临床试验设计、提升患者生存质量至关重要 。然而,寻找预测生物标志物困难重重,疾病生物学与治疗手段间的复杂关联,特别是免疫疗法缺乏明确分子生物标志物假设,使得这一任务充满挑战。加之高维数据带来的冗余性,以及众多预后因素的干扰,传统回归方法难以满足需求,亟需新的解决方案。

预测生物标志物建模框架(PBMF)的设计

PBMF 是一种借助神经网络的对比学习框架,其核心在于独特的训练目标。通过利用治疗与对照效果的比率,PBMF 能够直接学习治疗特异性的预测信号,而非预后信号。在模型训练目标中纳入生物标志物得分临界值和样本流行率约束条件,避免了事后调整的麻烦。为降低过拟合风险,该框架采用集成学习策略,训练多个神经网络,并可选择将神经网络输出提炼为可解释的决策树,增强了结果的临床实用性 。此外,PBMF 还提供了一个公开可用的网络应用程序,方便研究人员使用。

PBMF 在多种场景下的卓越表现

  1. 模拟数据测试:在模拟数据场景中,PBMF 展现出强大的能力。面对包含预测和预后信号的复杂数据,它能够有效识别复合预测信号。与传统方法如基于差异效应搜索的亚组识别(SIDES)和虚拟双胞胎(VT)相比,PBMF 在合成数据测试中表现更优,其精度 - 召回曲线下面积(AUPRC)达到 0.918 ± 0.047,远超 VT 的 0.858 ± 0.029 。
  2. 临床数据集评估:研究人员在 9 个不同的临床研究中对 PBMF 进行了全面评估,涵盖了多种疾病(如乳腺癌、糖尿病视网膜病变、肾癌、非小细胞肺癌等)和不同阶段的免疫肿瘤学临床试验。结果表明,PBMF 在识别预测生物标志物方面显著优于其他方法,在多个试验中成功找到可推广的预测生物标志物,而 SIDES 和 VT 则存在局限性,如 SIDES 在部分试验中无法找到预测生物标志物,VT 在某些情况下会误判有益群体。
  3. 真实世界数据验证:尽管真实世界数据(RWD)存在数据质量不一致、可比性差和偏倚等问题,研究人员仍利用 Tempus 的非小细胞肺癌(NSCLC)真实世界数据队列对 PBMF 进行了测试。结果显示,PBMF 在训练和测试数据集上均表现出色,能够准确识别出对免疫检查点抑制剂(ICI)治疗有预测价值的生物标志物,而 VT 在测试数据集上未能成功推广。
  4. 合成对照臂试验:针对早期单臂试验难以获取特定治疗生物标志物的问题,研究人员在 “合成对照臂” 场景下对 PBMF 进行了评估。在肾细胞癌和转移性尿路上皮癌等疾病的研究中,PBMF 能够利用单臂试验数据和合成对照臂数据,有效识别出预测生物标志物,且在测试数据集上表现良好,展现出其在早期临床试验数据应用中的潜力。

PBMF 的深入分析与解读

  1. 可解释性探索:为使生物标志物策略更具临床可操作性,PBMF 通过将复杂的神经网络模型提炼为简单的决策树,增强了模型的可解释性。例如,在 POSEIDON 免疫检查点抑制剂研究中,通过分析决策树发现,B + 个体的特征与肿瘤相关巨噬细胞(TAMs)低签名或 B 细胞高签名有关,这些特征可能影响免疫治疗效果 。在 TEMPUS 真实世界数据队列研究中,B + 个体则与低 E2F 特征签名或高 IFN-γ 反应特征签名相关。
  2. 构建发现管道:研究人员基于 PBMF 构建了一个端到端的生物标志物发现管道,旨在通过早期研究数据指导 3 期临床试验的患者选择策略。以非小细胞肺癌二线阿替利珠单抗治疗为例,利用 2 期 POPLAR 试验数据训练 PBMF 模型,在 3 期 OAK 试验数据中进行测试,成功识别出一个可推广的预测生物标志物。经过提炼后的决策树模型进一步提高了预测效果,相比原模型降低了患者死亡风险,为临床实践提供了更具价值的指导。

PBMF 的应用前景与局限

  1. 应用潜力巨大:PBMF 作为一个端到端的应用程序编程接口(API),具有高度的灵活性和兼容性,能够与多种预训练模型集成,处理来自不同数据模态(如基因组、放射组和临床数据)的信息。这使得它在预测生存结果、不良事件、剂量反应关系、联合治疗效果以及反向推导新药物靶点等方面具有广阔的应用前景,有望成为精准医学领域生物标志物发现的核心工具。
  2. 局限性:尽管 PBMF 表现出色,但也存在一定的局限性。例如,它无法确保在给定队列的可用特征中一定存在预测信号;在将集成模型提炼为简单模型时,可能会损失部分预测能力;强预后特征可能干扰预测信号的识别;其对比损失函数可能会忽略在对照治疗中有适度积极作用但在目标治疗中更有益的生物标志物 。此外,任何由 PBMF 提名的生物标志物都需要前瞻性临床验证。

研究结论

PBMF 在预测生物标志物发现领域展现出显著优势,在多种复杂场景下均优于现有方法。通过独特的设计和训练目标,它能够准确识别预测生物标志物,为临床决策提供有力支持。尽管存在一些局限性,但随着研究的深入和技术的发展,PBMF 有望在精准医学中发挥更大的作用,推动临床试验的优化和患者治疗效果的提升 。未来研究可进一步探索其在更多复杂场景下的应用,以及如何克服现有局限性,使其更好地服务于临床实践。
相关新闻
生物通微信公众号
微信
新浪微博


生物通 版权所有