可解释人工智能在局部晚期直肠癌新辅助放化疗后病理完全反应预测中的前瞻性多中心人机交互研究

时间：2026年1月22日

来源：International Journal of Radiation Oncology*Biology*Physics

编辑推荐：

本研究针对局部晚期直肠癌（LARC）患者新辅助治疗（NAT）后病理完全缓解（pCR）术前评估的临床难题，开发并前瞻性验证了名为RAPIDS-II的可解释人工智能模型。该模型整合了NAT后/全直肠系膜切除术（TME）前磁共振成像（MRI）影像组学特征与临床病理因素，在测试集和前瞻性验证队列中均表现出稳健的预测性能（AUC分别为0.813和0.795），并能显著提升放射科医生（尤其是初级医生）视觉评估的敏感性和综合诊断效能。SHapley Additive exPlanations（SHAP）分析提供了模型决策的直观解释，增强了临床可接受性，为LARC个体化治疗决策提供了可靠辅助工具。

对于局部晚期直肠癌（LARC）患者而言，新辅助放化疗（NAT）后接受全直肠系膜切除术（TME）是标准治疗方案。然而，约有15%至27%的患者在接受NAT后可达到病理完全缓解（pCR），这意味着肿瘤被完全清除，预后极佳。这部分患者或许可以避免手术及其带来的并发症，选择保肛及功能保全策略，从而显著提升生活质量。因此，如何在术前精准识别出这些pCR患者，成为了临床决策的关键难点。目前，高分辨率磁共振成像（MRI）虽是直肠癌分期和疗效评估的金标准，但在区分治疗后残留肿瘤与治疗反应（如纤维化）方面仍力有不逮，导致视觉评估存在局限性。尽管影像组学技术的发展带来了超越视觉解读的客观评估新希望，但先前的研究模型多面临前瞻性验证缺乏、临床可解释性不足（即“黑箱”问题）等挑战，阻碍了其临床转化应用。

为了破解这一难题，一项发表在《International Journal of Radiation OncologyBiologyPhysics》的研究报道了名为RAPIDS-II的可解释人工智能模型，该模型旨在基于NAT后/TME前的多参数MRI影像组学特征，结合临床病理因素，精准预测LARC患者的pCR状态，并在一项前瞻性、多中心、人机交互临床研究（NCT04278274）中验证了其有效性和临床辅助价值。

研究人员开展此项研究主要运用了几个关键技术方法：首先，他们回顾性收集了823例LARC患者的临床资料和NAT后/TME前MRI图像（包括T2加权成像T2WI、扩散加权成像DWI和动态对比增强DCE序列），并手动勾画肿瘤区域提取大量影像组学特征，经过特征筛选和可重复性评估后，利用深度残差收缩网络（DRSN）构建放射组学模型并生成Radscore。接着，通过多变量分析筛选出显著的临床病理因素（临床T分期cT、临床N分期cN、治疗前癌胚抗原pre-CEA和治疗后癌胚抗原post-CEA），与Radscore整合，采用极端梯度提升（XGBoost）算法构建了多模态的RAPIDS-II预测模型。最后，研究在一个前瞻性收集的207例患者队列中验证了模型的性能，并评估了该模型辅助六名不同年资放射科医生进行视觉评估的效果。此外，研究利用SHapley Additive exPlanations（SHAP）方法对模型的预测结果进行解释和可视化，以增强其临床可接受性。

结果

患者特征

回顾性队列的823例患者被随机分为训练集（n = 575）和测试集（n = 248）。前瞻性验证队列纳入207例符合标准的患者。各组患者的基线特征，如年龄、性别、cT分期、cN分期、癌胚抗原水平等，在pCR与非pCR患者间的分布在训练集、测试集和前瞻性队列中基本均衡。

RAPIDS-II模型在测试集中的性能

基于19个筛选后影像组学特征构建的DRSN模型（仅影像组学）在测试集中预测pCR的曲线下面积（AUC）为0.806。结合了Radscore和临床病理因素（cT分期、cN分期、pre-CEA、post-CEA）的RAPIDS-II多模态模型表现更优，在训练集和测试集中的AUC分别达到0.930和0.813，显著优于单纯的DRSN模型。

RAPIDS-II模型在前瞻性验证中的性能

在前瞻性验证队列中，RAPIDS-II模型依然表现出稳健的预测能力，AUC为0.795，显著高于DRSN模型（AUC = 0.754）。与放射科医生的视觉评估相比，RAPIDS-II模型的AUC高于所有初级放射科医生（整体AUC = 0.673），并与部分高级放射科医生（整体AUC = 0.829）表现相当或更优。值得注意的是，放射科医生的视觉评估特异性较高但敏感性相对较低，而RAPIDS-II模型具有相对较高的敏感性，提示两者具有互补性。

人机交互临床验证

当放射科医生参考RAPIDS-II模型的预测结果对判断不一致的病例进行重新评估后，其诊断性能得到提升。特别是初级放射科医生，其诊断的AUC和敏感性均有显著提高。例如，初级医生R1的敏感性从0.390提升至0.576。高级放射科医生在保持高特异性的同时，敏感性也有所改善。这表明RAPIDS-II模型能够有效辅助临床医生，尤其是经验较少的医生，做出更准确的判断。

RAPIDS-II模型的解释与可视化

通过SHAP分析，研究对模型的预测逻辑进行了解释。结果显示，Radscore对RAPIDS-II模型的最终预测贡献最大。在影像组学特征中，“DWI_wavelet.LLH_GLSZM_LGLZE”（f₁₅）、“DCE_wavelet.LLH_GLRLM_LRLGLE”（f₁₃）和“DCE_wavelet.HHL_GLSZM_SALGLE”（f₁₀）是影响Radscore最重要的三个特征。SHAP力力图可以直观展示每个特征（包括Radscore和临床因素）如何影响个体患者的pCR预测概率，从而为临床医生理解模型的每一个决策提供了透明窗口。

RAPIDS-II模型的预后意义

中位随访40个月的生存分析显示，被RAPIDS-II模型预测为pCR的患者，其总生存期（OS）、无病生存期（DFS）、局部无复发生存期（LRFS）和远处无转移生存期（DMFS）均显著优于被预测为非pCR的患者。进一步分析发现，在病理证实为非pCR的患者中，被模型错误预测为pCR的患者，其5年内局部复发和远处转移的风险似乎低于被模型正确识别为非pCR的患者，提示模型预测可能蕴含了超越病理诊断的预后信息。

讨论与结论

RAPIDS-II研究成功开发并前瞻性验证了一个整合NAT后/TME前MRI影像组学和临床病理因素的可解释AI模型，用于预测LARC患者的pCR状态。该模型表现出良好的预测性能，并能有效提升放射科医生（尤其是初级医生）的诊断准确性。通过SHAP方法实现的模型可解释性，大大增强了其结果在临床实践中的可信度和可接受度。这项研究标志着可解释AI在精准肿瘤学，特别是直肠癌个体化治疗决策支持领域迈出了坚实的一步。RAPIDS-II模型有望成为一种实用的临床辅助工具，帮助医生更准确地识别出可能从非手术“等待观察”策略中获益的pCR患者，同时也为误判病例的预后分层和后续治疗策略调整提供了潜在线索。未来，通过融入更多模态数据（如内镜、肛指检查）以及实现自动化图像分割，模型性能和应用便捷性有望得到进一步提升。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部