编辑推荐:
这篇研究通过整合蛋白质组学与机器学习技术(RF/SVM/BaggedCART),首次利用SHAP可解释性人工智能(XAI)鉴定了5个关键蛋白(P48637/O43491/O95302/Q96CX2/P49189),成功预测高级别浆液性卵巢癌(HGSOC)患者新辅助化疗(NACT)后残余病灶状态(R0/R1)。随机森林模型表现最优(AUC 0.955),揭示了谷胱甘肽合成酶(GSH)等蛋白通过化疗耐药通路影响临床结局,为个体化治疗提供新靶点。
1 引言
高级别浆液性卵巢癌(HGSOC)占卵巢癌病例的70%,其5年生存率在晚期患者中骤降至25-30%。残余病灶状态(R0/R1)是影响预后的关键因素,但现有临床手段难以在术前准确预测。蛋白质组学技术能系统性分析肿瘤特异性蛋白,而人工智能(AI)为挖掘复杂数据提供了新工具。本研究首次将SHAP解释性AI与蛋白质组学结合,旨在建立可预测NACT疗效的生物标志物体系。
2 材料与方法
研究纳入20例HGSOC患者的术前肿瘤组织样本,通过质谱检测4360种蛋白后筛选97个差异表达靶点。采用BORUTA算法进一步锁定18个关键蛋白,并构建随机森林(RF)、支持向量机(SVM)和装袋决策树(BaggedCART)三种模型。为解决样本不平衡问题(R0=14 vs R1=6),采用ROSE算法进行过采样与欠采样处理。
3 结果
RF模型展现出最优性能:AUC达0.955,灵敏度0.904,特异性0.763。SHAP分析揭示前5位核心蛋白:
4 讨论
这些蛋白涉及三大耐药机制:
值得注意的是,EPB41L2在人类蛋白质图谱中显示与不良预后相关,而KCTD12突变已被发现于其他浆液性癌中。
5 结论
该研究开创性地将XAI应用于卵巢癌蛋白质组学分析,不仅构建出高精度预测模型,更鉴定出具有临床转化潜力的生物标志物群。未来需扩大样本验证这些靶点,并探索其与BRCA突变/HRD状态的协同效应,为实现"化疗敏感性图谱"奠定基础。
生物通 版权所有