基于机器学习的慢性肾脏病(CKD)手术患者术后急性肾损伤风险预测模型:开发、验证及基于 SHAP 的可解释性分析

时间:2026年5月21日
来源:Renal Failure

编辑推荐:

本研究旨在开发机器学习模型,以预测既往患有慢性肾脏病(CKD)的手术患者发生术后急性肾损伤(AKI)的风险,这是一种与高发病率及疾病加速进展相关的严重并发症。研究人员利用来自 MIMIC-IV 数据库的 3,851 例 CKD 手术患者的数据,依据改善全球肾脏

广告
   X   

本研究旨在开发机器学习模型,以预测既往患有慢性肾脏病(CKD)的手术患者发生术后急性肾损伤(AKI)的风险,这是一种与高发病率及疾病加速进展相关的严重并发症。研究人员利用来自 MIMIC-IV 数据库的 3,851 例 CKD 手术患者的数据,依据改善全球肾脏病预后组织(KDIGO)标准定义的 AKI,开发了九种监督式机器学习模型进行预测。结果显示,24.2%(932/3,851)的患者发生了术后 AKI。其中,极端梯度提升(XGBoost)模型表现出最佳的预测性能,其受试者工作特征曲线下面积(AUC)为 0.844,准确率为 0.791,敏感性为 0.79,F1 分数为 0.73,随机森林(Random Forest)和轻量级梯度提升机(LightGBM)紧随其后。校准曲线显示预测风险与观察风险之间具有良好的一致性。为增强可解释性,研究人员采用 SHapley 附加解释(SHAP)分析,识别出序贯器官衰竭评估(SOFA)评分、估算肾小球滤过率(eGFR)、收缩压、白蛋白和磷为最具影响力的预测因子。结论表明,机器学习模型(尤其是 XGBoost)能够对该高危人群的术后 AKI 提供准确且可解释的预测。可解释人工智能的整合促进了透明的风险分层,可能有助于支持个性化的围手术期护理及实时临床决策支持系统的开发。
慢性肾脏病(CKD)患者术后并发急性肾损伤(AKI)已不再被视为随机并发症,而是脆弱的生理环境下可预测的围手术期急症,其特征为肾单位储备减少、自动调节功能受损以及对血流动力学和炎症应激源的易感性增加。在 CKD 患者中,即使是轻微的围手术期干扰也可能引发肾功能的迅速恶化,表明 AKI 遵循可识别且潜在可修正的轨迹。然而,目前缺乏针对既往患有 CKD 的手术患者的经验证预测工具。现有的大多数 AKI 预测方法为静态单时间点模型,主要依赖表格变量,未能充分利用多模态围手术期数据,且往往忽视 CKD 特异性变量或未能考虑围手术期参数与肾脏结局之间的非线性关联。此外,针对该特定人群的预测模型几乎空白。鉴于此,研究人员利用医疗信息集市重症监护数据库第四版(MIMIC-IV)的丰富数据,旨在开发并验证一种机器学习模型,用于预测 CKD 手术患者的术后 AKI 风险,以期将 AKI 的预防从被动风险评估转变为主动的前瞻性肾脏保护。

研究人员开展了一项回顾性队列研究,数据来源于 MIMIC-IV 数据库(版本 2.2),纳入了 2008 年至 2019 年间在贝斯以色列女执事医疗中心重症监护病房(ICU)接受手术的成年 CKD 患者。研究排除了术前已存在 AKI、住院时间短于 48 小时以及术前已接受维持性透析的患者。最终队列包含 3,851 例患者。研究人员提取了包括人口统计学特征、合并症、术前实验室指标、生命体征、临床严重程度评分以及手术和围手术期变量在内的多维数据。在方法学上,研究人员采用了 MissForest 算法处理缺失值,并运用最小绝对收缩和选择算子(LASSO)回归与 Boruta 算法进行特征选择,以剔除冗余变量并优化模型泛化能力。随后,构建并比较了包括逻辑回归、随机森林(RF)、极端梯度提升(XGBoost)、轻量级梯度提升机(LightGBM)等在内的九种机器学习算法。模型通过网格搜索结合 5 折交叉验证进行超参数调优,并使用受试者工作特征曲线下面积(AUC)、准确率、敏感性、特异性、F1 分数及校准曲线等指标评估性能。最后,应用 SHapley 附加解释(SHAP)方法对最优模型进行了解释性分析,以量化各特征对预测结果的贡献度。

研究结果显示,在纳入的 3,851 例患者中,术后 AKI 的发生率为 24.2%。发生 AKI 的患者年龄较大,合并充血性心力衰竭、糖尿病和高血压的比例较高,且术前肌酐水平更高,eGFR 和白蛋白水平更低,SOFA 评分和简化急性生理学评分 II(SAPS II)更高。在模型性能方面,XGBoost 模型表现最佳,AUC 达到 0.844,准确率为 0.791,敏感性为 0.79,F1 分数为 0.73,显著优于随机森林(AUC=0.822)、LightGBM(AUC=0.804)及传统逻辑回归(AUC=0.793)等模型。校准曲线表明 XGBoost 模型的预测概率与实际发生概率高度一致。特征重要性分析指出,SOFA 评分、eGFR、收缩压、血清白蛋白和血磷是影响预测结果的前五位关键因子。SHAP 分析进一步揭示,较高的 SOFA 评分与 AKI 风险增加相关,而较高的 eGFR 则与风险降低相关,证实了器官功能障碍和肾功能基线状态在预测中的核心作用。

讨论部分指出,本研究开发的基于集成学习的模型,特别是 XGBoost,通过整合常规临床数据,实现了对 CKD 手术患者术后 AKI 的高精度预测。SHAP 分析不仅验证了已知风险因素,还提供了个体层面的可解释性,这对于临床个性化决策至关重要。该模型若整合至电子病历系统中,可作为实时风险计算器,辅助临床医生在不可逆损伤发生前采取预防措施,如优化液体管理、避免肾毒性药物使用等。然而,研究也存在局限性,包括数据来源于单中心回顾性数据,缺乏外部验证,且部分关键围手术期变量因缺失率高未被纳入。未来的研究应致力于多中心外部验证、前瞻性实施评估,并探索结合动脉波形、超声血流动力学等多模态数据的动态预测系统,以及开发基于数字孪生和大型语言模型(LLM)的智能决策支持工具,以实现从静态预测向实时、自适应的围手术期肾脏保护系统的跨越。

结论部分总结道,本研究基于 MIMIC-IV 数据库开发并验证了多种机器学习模型,证明集成模型(尤其是 XGBoost)在区分度和校准度上优于传统算法。SHAP 分析的应用成功解析了个体预测结果并识别出关键风险因素,包括 SOFA 评分、eGFR、收缩压、白蛋白和磷。这些结果表明,可解释的机器学习模型可作为高危手术人群围手术期风险分层和 AKI 靶向预防的有价值工具。未来的工作应集中于外部验证、临床工作流整合以及实际影响的评估。

生物通微信公众号
微信
新浪微博


生物通 版权所有