基于机器学习的基因组数据预处理提升BRAFV600突变黑色素瘤患者MAPK抑制剂疗效预测

时间:2025年7月10日
来源:npj Precision Oncology

编辑推荐:

本研究针对BRAFV600突变晚期黑色素瘤患者MAPK抑制剂(MAPKi)响应持续时间预测难题,通过整合临床特征与预处理基因组数据(如突变率、通路分析),开发机器学习模型。研究证实添加KEGG/VCELLS黑色素瘤通路突变率特征可使预测准确率提升12%-28%,为临床决策提供新工具。论文发表于《npj Precision Oncology》。

广告
   X   

黑色素瘤治疗领域近年来因MAPK抑制剂(MAPKi)和免疫检查点抑制剂(ICI)的应用发生革命性变化,但肿瘤耐药性仍是主要挑战。尤其对于BRAFV600突变患者,虽然初始响应率高,但个体疗效差异显著,亟需可靠预测工具。传统临床特征预测能力有限,而基线基因组数据的价值尚未明确。法国蒙彼利埃大学(University of Montpellier)联合德国波恩大学的研究团队通过机器学习算法挖掘预处理基因组数据的潜在价值,为精准医疗提供新思路。

研究采用随机生存森林(RSF)、梯度提升生存模型(GBS)等五种算法,结合三类基因组数据预处理策略:1)功能突变筛选(FATHMM/Cscape);2)黑色素瘤通路基因集(KEGG-Mel/VCELLS-Mel);3)通路突变率统计(MRKEGG-Mel)。利用来自四个中心的184例患者队列(训练集n=111,验证集n=73),通过5折嵌套交叉验证评估模型性能。

患者特征与数据预处理
分析显示不同队列间临床特征存在异质性(表1),但突变基因比例具有可比性(2%-18.8%)。针对黑色素瘤高突变负荷特点,研究团队创新性地采用通路突变率代替单个基因突变,减少噪声干扰。

模型性能评估
在测试集中,整合临床特征与VCELLS-Mel通路突变率的GBS模型表现最优,C-index达0.74,显著优于单纯临床模型(图2)。该模型在12个月进展预测场景中,正确分类患者数提升16%-28%(图4d)。

临床场景验证
在"12个月内进展"预测场景中,MRVCELLS-Mel/RSF组合的C-index(0.64)优于临床模型(0.61)。动态AUC分析显示基因组数据可提升全时间段的预测稳定性(补充图3)。

机制探讨
研究意外发现治疗前肿瘤突变谱包含响应持续时间信息,这与耐药机制多源于治疗中适应性突变的传统认知相悖。研究者推测可能反映肿瘤初始异质性对治疗压力的潜在影响,但具体机制需单细胞研究验证。

该研究首次证明常规临床测序数据经机器学习处理后具有预测价值,尤其通路突变率特征可稳定提升模型性能。虽然存在样本异质性、测序覆盖度等局限,但为开发整合基因组特征的临床决策工具奠定基础。未来扩展全外显子数据可能进一步优化预测效能。

关键方法概述:1)收集4个中心184例接受MAPKi治疗的BRAFV600突变患者临床和基因组数据;2)采用FATHMM/Cscape进行功能突变注释,KEGG/VCELLS通路分析;3)应用RSF、GBS等生存分析算法;4)通过5折交叉验证评估C-index、动态AUC等指标;5)设置两种临床场景验证实用性。

生物通微信公众号
微信
新浪微博


生物通 版权所有