引言
由严重急性呼吸综合征冠状病毒2(SARS-CoV-2)引起的2019冠状病毒病(COVID-19)已导致全球范围内巨大的健康负担。重症COVID-19患者可能需要机械通气(MV)或体外膜肺氧合(ECMO)支持,并且面临较高的死亡风险。尽管MV可以挽救生命,但它也可能导致呼吸机相关损伤等并发症。因此,准确预测患者的预后对于临床管理和有限医疗资源(如呼吸机和ECMO设备)的合理分配至关重要。
以往的研究尝试开发数据驱动的预测模型,包括启发式评分系统和更复杂的计算模型,用于预测MV需求、MV持续时间、死亡率等。然而,这些方法通常将这些结局指标作为独立的现象进行建模,未能系统性地整合预测。本研究旨在开发一种能够联合预测MV时长、ECMO使用和死亡率的分层机器学习方法,以更全面地理解COVID-19患者的疾病进程。
研究方法
研究数据来源于埃默里大学医院COVID CRADLE数据集,时间跨度为2020年2月28日至2022年1月24日。最终纳入分析的队列包括10,378名SARS-CoV-2检测呈阳性且住院时间至少为3天的患者。患者的中位年龄为60岁,男女比例接近。
研究使用的特征包括静态特征和动态特征。静态特征包括人口统计学信息(如种族、民族、年龄、性别)、体重指数(BMI)和体重。动态特征则是在住院前3天内采集的生命体征和实验室结果的时间序列数据,包括氧饱和度(O2Saturation)、体温、吸入氧浓度(FiO2)、氧流量、心率、坐位收缩压和舒张压。
研究的目标是预测三个结局:MV持续时间(分为0天、1-4天、5-9天、10-14天、15-19天、20-24天、25-29天及≥30天共8个类别)、ECMO使用(是/否)以及院内死亡率(是/否)。由于数据集存在明显的类别不平衡问题,例如仅有0.14%的患者使用了ECMO,研究对训练和验证集中的低频率结局类别进行了随机上采样处理。
模型开发方面,研究构建并比较了三种机器学习模型:分层递归神经网络(RNN)、模型链式决策树(DT)和模型链式逻辑回归(LR)。其中,RNN模型是核心创新点,它采用双向长短期记忆(LSTM)层来处理动态特征的时间依赖性,然后将学习到的表示与静态特征结合,依次预测MV时长、ECMO使用和死亡率,并将三个任务的损失函数结合进行端到端训练。决策树和逻辑回归模型则采用模型链式结构,即前一个模型的预测结果作为后一个模型的输入特征之一,但每个组件是独立训练的。
数据集被随机分为训练集(60%)、验证集(20%)和测试集(20%)。模型性能评估指标包括受试者工作特征曲线下面积(AUROC)、精确率-召回率曲线下面积(AUPRC)和F分数。由于类别不平衡,报告了加权平均和宏平均结果。
研究结果
队列分析显示,大多数患者(78.44%)未使用机械通气。需要MV的患者中,使用时间较短(1-4天,7.82%)的占比较高,而需要长时间通气(≥30天,5.03%)的比例相对较低。ECMO使用率极低(0.14%),院内死亡率为10.73%。
模型性能比较表明,递归神经网络(RNN)在预测MV时长、ECMO使用和死亡率方面,其加权平均AUROC(分别为0.873, 0.902, 0.774)和加权平均AUPRC(分别为0.790, 0.999, 0.893)均优于决策树(DT)和逻辑回归(LR)模型。特别是在ECMO预测上,RNN的AUROC显著高于其他模型。在F分数方面,决策树在MV时长和死亡率预测上表现最佳,而三个模型在ECMO预测上的F分数几乎相同。RNN模型的Brier分数也相对较低,表明其预测概率的校准度较好。
特征重要性分析通过排列重要性(Permutation Importance)和SHAP(SHapley Additive exPlanations)方法进行。分析发现,对所有模型预测均有重要影响的特征包括坐位收缩压和舒张压、心率、氧饱和度(O2Saturation)、年龄、BMI、种族和体重。RNN模型依赖的特征相对较少且集中,而DT和LR模型则依赖于更多样化的特征集,例如还包括FiO2、氧流量、民族和性别等。
讨论与展望
本研究表明,基于递归神经网络(RNN)的分层机器学习模型能够有效利用患者住院早期的 demographics 数据和生命体征时间序列数据,联合预测COVID-19患者的机械通气(MV)时长、ECMO需求和死亡风险。RNN模型凭借其处理时序数据的能力和端到端的训练方式,展现了最优异的预测性能。
特征重要性分析揭示了与COVID-19重症化相关的关键临床指标,这些发现与已有的病理生理学认识一致,也验证了模型的可解释性。RNN模型依赖较少的关键特征进行预测,这有利于简化临床数据收集流程,但同时也可能对数据的完整性有更高要求。
本研究也存在一些局限性。纳入标准要求患者具备所有特征类型的测量值,这可能引入了选择偏倚,偏向于监测更密切或病情更严重的患者。极低的ECMO发生率限制了该预测结果的临床直接应用潜力。此外,模型未利用患者既往的住院历史信息,且尚未进行实时预测的验证和临床部署。
未来的研究方向包括探索对缺失数据更鲁棒的训练方法(如随机特征丢弃),研究Transformer等更先进的序列模型(可能需结合迁移学习以应对数据量需求),整合患者既往病史信息以提升预测精度,以及将种族/民族特征替换为更能反映健康差异的社会决定因素指标。最终,在真实的临床环境中进行实时预测验证和效果评估是推动此类模型实际应用的关键步骤。
结论
总而言之,这项回顾性预后研究证实,基于分层递归神经网络(RNN)的机器学习模型,在利用临床变量和人口统计学信息预测COVID-19患者机械通气(MV)时长、体外膜肺氧合(ECMO)需求及死亡率方面表现出巨大潜力。该模型的高性能预测能力有望为临床医生提供决策支持,助力实现个性化治疗,优化机械通气等关键医疗资源的使用,从而改善COVID-19患者的临床结局。