在医疗领域,心脏骤停(Cardiac Arrest,CA)一直是一个严峻的挑战。它如同隐藏在暗处的 “杀手”,随时威胁着人们的生命健康。据统计,美国每年有近 380,000 人因 CA 导致死亡 ,即便医疗技术不断进步,CA 患者的死亡率和致残率依旧居高不下,这背后主要是心脏骤停后脑损伤以及其他致命器官功能障碍在作祟。
对于临床医生而言,准确预测 CA 患者的死亡率至关重要,这能帮助他们及时发现高风险因素并进行干预,从而改善患者的预后。然而现有的预测手段存在诸多不足。像序贯器官衰竭评估(Sequential Organ Failure Assessment,SOFA)、急性生理与慢性健康评估(Acute Physiological and Chronic Health Evaluation,APACHE)II 以及简化急性生理学评分(Simplified Acute Physiology Score,SAPS)等通用疾病严重程度评分,对 CA 患者死亡率的预测能力仅处于中等水平。而特定风险评分,如 NULL-PLEASE 评分虽能有效预测院内心脏骤停(Out-of-Hospital Cardiac Arrest,OHCA)患者的院内死亡率,CREST 评分却只能用于预测非 ST 段抬高型心肌梗死患者的死亡率,且这些评分仅适用于 OHCA,还涉及记录常不准确的院前变量。此外,大多数评分采用传统回归分析对变量进行简单加权,难以精准预测。
为了攻克这些难题,来自浙江大学医学院附属杭州市第一人民医院等机构的研究人员开展了一项重要研究,相关成果发表在《Scientific Reports》上。
研究人员为了开发出一个可靠的预测模型,从多个方面进行了努力。在数据来源上,他们从 Medical Information Mart for Intensive Care IV 数据库(MIMIC-IV)版本 2.2 中提取了 721 例患者的数据,同时收集了浙江省四家三级医院的 856 例患者作为外部验证集。这些数据涵盖了人口统计学特征、生命体征、实验室结果、临床评分和治疗措施等多方面信息。
在技术方法上,研究人员运用了多种机器学习(Machine Learning,ML)算法 。首先对数据进行预处理,通过排除缺失值超过 25% 的变量,并利用 R 软件中的 “mice” 包进行多变量插补和单热编码处理。接着,他们选择了 11 种常见的 ML 算法,包括逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,SVM)等,基于心脏自主循环恢复(Return of Spontaneous Circulation,ROSC)后 72 小时的数据构建预测模型。之后采用递归特征消除(Recursive Feature Elimination,RFE)确定关键特征,通过随机搜索调整超参数,以提高模型准确性。同时,利用 SHapley 加性解释(SHapley Additive exPlanations,SHAP)方法对模型进行可视化解释,让模型的预测结果更具可解释性。
在模型开发与验证方面,研究人员构建了基于 11 种 ML 算法的预测模型。结果显示,CatBoost 算法表现最为出色,其在 72 小时时的受试者工作特征曲线下面积(Area Under the Curve,AUC)达到 0.84(95% CI:0.78,0.91) 。通过 RFE 筛选出 11 个关键变量,如年龄、心率、舒张压(DBP)等,构建了精简模型。在内部验证中,该精简模型 AUC 达到 0.86(0.80,0.92) ,在外部验证中 AUC 为 0.76(0.73,0.79),均显著优于其他模型。
在模型的可解释性分析上,SHAP 方法发挥了重要作用。通过 SHAP 总结图进行全局解释,发现白细胞(WBC)、心率、碳酸氢盐、平均血压(MBP)和年龄是预测 CA 死亡率的前五大有效特征。SHAP 力场图则对模型预测进行个体解释,帮助临床医生直观了解每个患者的死亡风险以及各特征的贡献程度。
该研究具有多方面的重要意义。首次将 CatBoost 算法应用于 CA 患者院内死亡率预测,为临床提供了一种新的、更有效的预测工具。研究强调了 72 小时数据在构建预测模型中的重要性,弥补了以往多依赖 24 小时内数据的不足,更能反映患者实际生理状态。通过 SHAP 分析,让复杂的风险预测变得更易理解,有助于临床医生优化治疗策略。尽管模型在外部验证中整体性能略逊于内部验证,但为后续研究指明了方向,如加强数据质量控制、扩大样本规模等。不过,研究也存在一定局限性,如缺乏院前数据和部分特定生物标志物,模型仅适用于生存超过 72 小时的 CA 患者,样本规模较小且为回顾性研究。但这并不影响其为未来的研究和临床实践提供宝贵的参考,相信在后续研究中,这些问题会逐步得到解决,从而更好地造福 CA 患者。<研究人员通过深入分析,从 mimic-iv 数据库筛选出 721 例 ca 患者数据,将其分为训练集和内部验证集,又收集浙江省四家三级医院 856 例患者作为外部验证集。在数据处理上,对缺失值进行严格处理,采用多变量插补和单热编码技术。构建模型时,运用 11 种 ml 算法,最终确定 catboost 算法表现最优,并通过 rfe 筛选出 11>研究人员通过深入分析,从>
研究结果显示,在内部验证中,72-h CatBoost 精简模型的 AUC 达到 0.86(0.80,0.92),敏感性为 0.73(0.62,0.82),特异性为 0.88(0.77,0.94) ;在外部验证中,该模型 AUC 为 0.76(0.73,0.79) ,同样显著优于其他模型。
从模型的可解释性来看,SHAP 分析发挥了关键作用。SHAP 总结图表明,白细胞(WBC)、心率、碳酸氢盐、平均血压(MBP)和年龄是预测 CA 死亡率的前五大有效特征;SHAP 力场图则直观展示了每个患者的死亡风险以及各特征的贡献程度,让临床医生能够更清晰地了解患者的情况。
研究结论表明,72-h CatBoost 模型在预测生存超过 72 小时的 CA 患者院内死亡率方面表现出色。它不仅为临床医生提供了一个可靠的预测工具,有助于及时调整治疗方案,提高患者生存率,而且为后续研究奠定了基础。
在讨论部分,研究人员指出该模型具有重要的临床价值,首次将 CatBoost 算法应用于 CA 患者死亡率预测是一大创新。同时,强调 72 小时数据在预测模型中的重要性,弥补了以往研究多依赖早期数据的不足。不过,研究也存在局限性,如缺乏院前数据和部分生物标志物、样本规模较小、模型适用范围有限以及研究的回顾性等问题。但这些不足也为未来的研究指明了方向,相信随着研究的深入,这些问题将逐步得到解决,进一步推动 CA 患者预后评估的发展,为更多患者带来希望。