基于机器学习的预测方法:冠状动脉疾病合并心力衰竭的老年住院患者三年内的死亡率

时间:2026年1月27日
来源:International Journal of Medical Informatics

编辑推荐:

本研究采用机器学习模型预测老年冠心病合并心衰患者三年死亡率,发现逻辑回归模型在Brier Score、AUC等指标上表现最优(0.1105, 0.9014)。SHAP分析揭示年龄、NT.proBNP、室间隔厚度等10项特征显著影响预后,其中年龄、白蛋白、NT.proBNP为关键风险因素。研究开发了在线预测工具并验证其临床应用价值。

广告
   X   

付世辉|赵子蕾|刘旭辉|郭建峰|王凯|赵亚丽|单楠|刘千硕|聂燕|田金文
中国人民解放军总医院海南医院心内科,海南老年疾病临床医学研究中心,中国老年疾病临床研究中心海南分中心,中国三亚

摘要

目的

准确预测生存结果对于早期干预和治疗优化至关重要。本研究旨在利用机器学习技术开发一个模型,以预测患有冠状动脉疾病(CAD)并伴有心力衰竭(HF)的老年住院患者的三年死亡率。

方法

本研究共纳入987名患有CAD的老年住院患者。这些患者被随机分为训练集和验证集,比例为7:3。采用了五种机器学习方法(包括逻辑回归、随机森林、支持向量机、极端梯度提升和梯度提升决策树)来构建预测模型。

结果

该队列的中位年龄为85岁(范围:81-89岁)。患有CAD并伴有HF的老年住院患者的三年死亡率为56.46%。最小绝对收缩量和选择算子方法以及五折交叉验证确定十个特征与三年死亡率显著相关。逻辑回归在Brier分数、曲线下面积、准确性、精确度、召回率和F1分数方面的表现优于其他模型,分别为0.1105、0.9014、0.8764、0.9167、0.8627和0.8889。Shapley加性解释方法显示,年龄、室间隔厚度、γ间隙、血清肌酐、N端pro-B型利钠肽(NT-proBNP)和中性粒细胞与淋巴细胞比率是风险因素,而平均收缩压、血红蛋白、白蛋白和钠是保护因素。年龄、白蛋白和NT-proBNP是与三年死亡率最相关的三个特征。该网络应用可访问于https://cad-hf-predict.tracebook.org.cn

结论

逻辑回归在预测患有CAD并伴有HF的老年住院患者的三年死亡率方面表现出优异的预测性能。

引言

冠状动脉疾病(CAD)是世界上最常见的心血管疾病之一,对医疗和经济负担都有显著影响[1],每年导致近700万人死亡和1.29亿伤残调整生命年[2]、[3]、[4]。在CAD患者中,心血管结构和功能的逐渐恶化是一个不良预后因素,最终可能导致心力衰竭(HF)[5]。CAD是HF病例中最重要的单一病因因素,约52%的HF患者患有CAD[6]。CAD会加重HF患者的临床结局,并增加其死亡风险[7]。尽管最近在HF治疗方面取得了进展,但在减缓疾病进展方面仍面临许多挑战,这导致了全球HF的生存率较低[8]。由于随着年龄的增长心血管功能逐渐下降,老年人群成为CAD伴HF的主要受影响群体[9]、[10]。中国老年人口占全球老年人口的五分之一,并且正在以稳定且快速的速度增长[11]。因此,特别是对于中国这样老年人口快速增长的国家,迫切需要针对CAD伴HF进行专门的研究和全面干预。及时识别和早期干预CAD伴HF的进展将对老年人群的临床结局大有裨益[12]。然而,大多数先前的研究集中在单独的疾病(CAD或HF)上,或涵盖了所有年龄段,针对患有CAD伴HF的老年住院患者的生存预测和预后分析的研究较少。
机器学习算法能够发现疾病之间的复杂关系,并广泛应用于疾病预测领域[13]。最近的综述认为,预测CAD的最佳机器学习模型是人工神经网络[14],预测HF的最佳模型是随机森林[15]。然而,关于针对患有CAD伴HF的老年住院患者的机器学习预后预测的研究仍然不足。本研究的目的是开发一个有效的模型,以预测患有CAD伴HF的老年住院患者的三年死亡率。建立这一模型旨在揭示与该人群死亡率密切相关的关键因素,以便在临床实践中进行深入分析。同时,它也可以应用于个别患者的分析,以确定重要的影响因素。临床医生可以据此采取相应措施来减缓疾病进展并改善患者结局。本研究引入了五种机器学习方法(包括逻辑回归、随机森林、支持向量机、极端梯度提升和梯度提升决策树)来对高风险患者进行分类,以便进行个性化医疗干预。Shapley加性解释(SHAP)分析可能为开发更有效的治疗提供有用信息。此外,还设计了一个基于网络的计算器,使用最优模型预测患有CAD和HF的老年住院患者的三年死亡率。该工具可以根据患者的风险对其进行分层,并评估每个变量对其死亡风险的贡献。医疗专业人员可以利用该计算器进行预测分析,根据预测结果制定治疗计划,并对被认为有较高不良结局风险的住院患者实施针对性干预措施。可以根据SHAP分析确定的对死亡风险有显著影响的变量来制定干预措施。

章节片段

研究对象

本研究基于中国老年心血管共病研究(CGCCS)的数据,分析了中国人民解放军总医院老年心脏病科收治的987名CAD住院患者。在这些住院患者中,共有294名年龄≥60岁且同时患有CAD和HF的患者。图1A展示了患者的入组过程和研究设计。中国人民解放军总医院作为指定的医疗机构,维护着全面可靠的记录。

特征

从患有CAD并伴有HF的老年住院患者中收集了相关特征(表2)。该队列的中位年龄为85岁(四分位数范围:81-89岁),年龄范围从60岁到100岁不等,其中男性占78.9%。该组中有大量患者出现多种并发症,其中大多数患者患有高血压(83.3%)和心房颤动(AF)(31.0%)。在药物使用方面,包括阿司匹林、氯吡格雷、β受体阻滞剂和钙通道阻滞剂等。

讨论

本研究开发了一个准确的模型,用于预测患有CAD并伴有HF的老年住院患者的三年死亡率。在五种机器学习模型中,逻辑回归的表现最佳。根据对患者的重新分类,高风险组的三年实际死亡风险是低风险组的3.5倍。高风险组的三年死亡率高达88.37%,这凸显了...

结论

本研究提出了一个准确的模型,用于预测患有CAD并伴有HF的老年住院患者的三年死亡率,并对风险群体进行分类。逻辑回归表现出优异的预测性能,建议将其应用于实际临床。针对平均收缩压(mSBP)、室间隔厚度(IVST)、血红蛋白、白蛋白、γ间隙、血清肌酐、NT-proBNP、钠和中性粒细胞与淋巴细胞比率(NLratio)的早期干预可能改善患有CAD并伴有HF的老年住院患者的生存结局。

作者贡献

所有作者均参与了手稿的起草和修订以及数据的分析和解释。

伦理批准声明

本研究方案已获得中国人民解放军总医院伦理委员会的批准,并符合1975年《赫尔辛基宣言》(1983年修订版)的规定。
资金声明
本项目得到了海南省自然科学基金(项目编号:821QN389、822MS198、824MS171、821MS117、824MS173、821MS115、823MS161)、海南省临床医学中心余孟孙院士工作站创新平台研究项目(项目编号:YSPTZX202406)以及海南省临床医学中心的支持。

作者贡献

所有作者均参与了手稿的起草和修订以及数据的分析和解释。

CRediT作者贡献声明

付世辉:概念构思。赵子蕾:写作、审稿与编辑、项目管理、数据分析。刘旭辉:项目管理。郭建峰:项目管理。王凯:项目管理。赵亚丽:项目管理。单楠:项目管理。刘千硕:项目管理。聂燕:项目管理。田金文:写作、审稿与编辑。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的研究工作。

致谢

我们感谢所有协调或参与本研究的研究人员。

生物通微信公众号
微信
新浪微博


生物通 版权所有