在重症监护医学领域,脓毒症始终是导致患者死亡的主要原因之一。全球每年约有4890万脓毒症病例,相关死亡人数高达1100万,占全球总死亡人数的20%。面对这一严峻挑战,临床医生迫切需要可靠的预测工具来识别高危患者,从而实施及时干预。目前,序贯器官衰竭评估(SOFA)评分作为脓毒症风险分层的金标准,通过评估呼吸、心血管、肝脏、凝血、肾脏和神经六个器官系统的功能状态来预测患者预后。然而,传统SOFA评分包含11个临床变量,在紧急的ICU环境中,收集全部变量不仅耗时,还可能因数据缺失影响评估准确性。更为重要的是,随着人工智能技术在医疗领域的深入应用,机器学习模型虽在预测性能上超越了传统评分系统,但其"黑箱"特性严重阻碍了临床接受度。医生难以理解这些模型是如何得出预测结果的,也不清楚各个临床变量对最终预测的具体贡献。这种透明度的缺失使得 clinicians 对机器学习模型持谨慎态度,尽管它们在统计性能上表现优异。为了解决这一难题,来自哥伦比亚工业大学的Camilo Santos研究团队在《IEEE Latin America Transactions》上发表了最新研究成果。研究人员创造性地将优势比分析与可解释人工智能技术相结合,开发了一种基于SOFA评分的可解释机器学习模型,并通过多中心验证证明了其临床适用性。研究团队采用了几个关键技术方法:利用MIMIC-IV v3.0数据库(包含15,100例ICU脓毒症患者)进行模型训练,并在eICU v2.0多中心数据库(8,201例患者)上进行外部验证;应用miceforest算法基于LightGBM进行多重插补处理缺失数据;通过优势比分析筛选与脓毒症死亡率最相关的临床变量;采用CatBoost机器学习算法构建预测模型;利用SHapley Additive exPlanations(SHAP)值进行模型可解释性分析。
机器学习模型比较分析
研究人员对十种机器学习模型进行了系统评估,包括逻辑回归、朴素贝叶斯、支持向量机、决策树、随机森林、多层感知机、梯度提升机、XGBoost、LightGBM和CatBoost。通过五折交叉验证在MIMIC-IV数据集上评估模型性能,并在eICU数据集上进行外部验证。结果表明,基于树的模型特别是CatBoost和梯度提升表现最佳,AUC值达到0.75(95% CI 0.75-0.76)。经过贝叶斯超参数优化后,CatBoost以更高的灵敏度被选为最终模型,在识别脓毒症死亡风险患者方面表现出色。