基于机器学习的全膝关节置换术后下肢深静脉血栓风险预测模型构建与验证

时间:2025年12月27日
来源:Medical Care

编辑推荐:

本研究通过回顾性分析1238例全膝关节置换术(TKA)患者临床数据,结合Lasso回归和Boruta算法筛选出贫血、输血量等11个关键风险因子,构建并比较了逻辑回归(LR)、XGBoost等6种机器学习模型。结果表明逻辑回归模型(AUC=0.691)在预测TKA术后深静脉血栓(DVT)风险中表现最优,SHAP可解释性分析揭示活化部分凝血活酶时间(APTT)缩短、麻醉时间延长等因素对DVT形成具有显著影响,为临床精准防控提供新策略。

广告
   X   

1. 引言
全膝关节置换术(TKA)是治疗膝关节疾病的常见手术,但术后深静脉血栓(DVT)发生风险较高,可能引发肺栓塞(PE)等严重并发症。随着全球老龄化加剧,DVT发病率逐年上升,尤其多见于大手术或长期卧床患者。近年来,人工智能技术逐步应用于DVT风险预测,机器学习模型通过分析临床指标和生物标志物数据,为医生提供精准决策支持。本研究基于6种机器学习方法构建TKA术后DVT风险预测模型,并通过SHAP方法进行可解释性分析,旨在揭示DVT形成的风险因素及其影响程度。
2. 对象与方法
2.1. 临床数据
回顾性收集山西医科大学第二医院2020年7月至2023年7月收治的3058例TKA患者病历,经纳入与排除标准筛选后,最终纳入1238例患者数据。纳入标准包括:年龄≥18岁、住院时间>3天、接受初次单侧TKA手术且病历完整;排除标准涵盖非 compartmental 置换、膝关节翻修术、双侧同期置换、术前已确诊DVT或PE、血栓病史、血液系统疾病或长期抗凝治疗者。
2.2. 观察指标
收集指标涵盖基本信息(年龄、性别、体重指数等)、既往史(吸烟史、高血压、糖尿病等)、手术指标(麻醉方式、ASA分级、止血带时间等)及生化指标(血红蛋白、HCT、D-二聚体、APTT等共63项特征)。
2.3. 统计分析
采用SPSS 26.0和RStudio 4.2.3软件进行数据分析。对缺失率≤30%的特征使用多重插补法填补,通过Lasso回归和Boruta算法筛选特征变量,构建逻辑回归(LR)、XGBoost、随机森林(RF)、AdaBoost、梯度提升决策树(GBDT)和K近邻(KNN)模型,以10折交叉验证优化超参数,并利用受试者工作特征曲线(ROC-AUC)、校准曲线、临床决策曲线(DCA)等评估模型性能。
3. 结果
3.1. 基线数据比较
DVT组(n=254)与非DVT组(n=984)在年龄、BMI、麻醉方式、过敏史、贫血、RCRI指数、PT、APTT、D-二聚体等16项指标上存在显著差异(P<0.05)。
3.2. 特征筛选
Lasso回归筛选出28个变量,Boruta算法进一步识别出贫血、输血量、失血量、HCT、D-二聚体、凝血酶时间(TT)、氯离子(CL)、麻醉时间、手术时间、APTT和术后运动疼痛评分等11个共同特征作为最终建模变量。
3.3. 模型性能比较
训练集中XGBoost和RF模型AUC达1.000,但验证集中逻辑回归模型表现最优(AUC=0.672)。综合校准曲线和DCA分析,逻辑回归模型具有最佳临床适用性和稳定性。
3.4. SHAP可解释性分析
APTT缩短(重要性最高)、麻醉时间延长、TT升高、术后运动疼痛评分增高、D-二聚体降低、CL降低、输血量增加、失血量增加、手术时间缩短及贫血均为DVT形成的风险因素。典型病例分析显示,非DVT患者SHAP评分仅为0.14,而DVT患者达0.59。
4. 讨论
本研究首次联合多种机器学习算法构建TKA术后DVT预测模型,逻辑回归模型在保证预测精度的同时兼具良好可解释性。APTT作为凝血功能核心指标,其缩短提示血液高凝状态;麻醉时间延长可能通过血流动力学改变增加血栓风险;D-二聚体降低可能与术前抗凝措施相关。研究局限性包括单中心回顾性设计、未纳入遗传因素及术后动态监测数据。未来需通过多中心前瞻性研究进一步验证模型泛化能力。

生物通微信公众号
微信
新浪微博


生物通 版权所有