基于多中心数据的重症儿童早期急性肾损伤预测模型的外部验证、再校准与扩展

时间:2026年5月27日
来源:Cornea Open

编辑推荐:

背景:急性肾损伤(AKI)在重症儿童中常见,且与高发病率和死亡率相关。旨在支持临床决策的风险预测模型有助于早期识别和主动干预AKI风险。现有模型主要依赖单中心数据进行验证,部分原因是缺乏足够详细的多中心数据集。目的:评估一个单中心模型在两个多中心数据集中,用于

广告
   X   

背景:急性肾损伤(AKI)在重症儿童中常见,且与高发病率和死亡率相关。旨在支持临床决策的风险预测模型有助于早期识别和主动干预AKI风险。现有模型主要依赖单中心数据进行验证,部分原因是缺乏足够详细的多中心数据集。目的:评估一个单中心模型在两个多中心数据集中,用于预测入住重症监护病房(ICU)72小时内新发AKI的能力,并优化该模型以提高预测性能,同时保持可接受的警报负荷。推导和验证队列:研究人员分析了两个数据集:儿科学习健康系统网络-虚拟儿科系统(PEDSNET-VPS)数据集,通过链接PEDSnet电子健康记录(EHR)提取数据与虚拟儿科系统(VPS)创建;以及PICU数据协作组(PDC)数据集,通过从八家参与机构提取和协调EHR数据创建。每个数据集被划分为推导集和测试集。预测模型:研究人员首先对现有的单中心模型进行再校准,并测量其在不同临界点的区分度(受试者工作特征曲线下面积[AUROC]和精确率-召回率曲线下面积[AUPRC])与性能。接着,他们添加了入住ICU 12小时时可获得的特征,以精确率和召回率为指标进行优化。他们测量了区分度及不同临界点的性能,并确定了对风险评分贡献最大的特征。结果:总共分析了186,540次ICU入院。根据血清肌酐标准,在入院72小时内发现早期AKI的比例为2.2-2.7%。对现有单中心模型进行初始再校准后,区分度较差(AUROC 0.65–0.78;AUPRC 0.10–0.12)。在添加新特征后,模型的AUROC提高至0.80–0.88,AUPRC提高至0.13–0.22。结论:在这项首次使用两个新的多中心数据集的研究中,研究人员发现,一个基于入住ICU 12小时时可获得的特征设计的模型在性能上有所提升,该模型在平衡敏感度和精确率以预测AKI风险患者方面表现更优。
重症儿童急性肾损伤(AKI)的发生率高达25%,且与高发病率和死亡率密切相关。重要的是,AKI在少数族裔和无保险儿童中更为常见。入住儿科重症监护病房(PICU)后最初72小时内新发的AKI可能是一个重要的干预目标。尽管已有呼吁采用更自动化和数据驱动的方法来预防AKI,但其识别目前主要仍基于反映已发生损伤的血清肌酐和尿量,属于反应性识别。因此,包括限制肾毒性药物、优化液体平衡和早期肾脏替代治疗在内的早期缓解策略常被错过。利用机器学习技术并结合以用户为中心的临床决策支持(CDS)的风险预测模型,为更早识别高风险患者和进行干预提供了机会。现有的针对重症儿童的AKI风险预测模型主要在单中心数据上开发和验证。肾脏炎症指数(RAI)是一个已通过多中心试验评估的AKI风险评分工具,但它是基于专家意见而非数据驱动方法开发的,依赖的出入量数据在电子健康记录(EHR)中可能不准确,在许多情况下可能代表已建立的损伤,并且在验证中漏诊了18.9%的严重AKI病例。同样,一个针对肾毒性药物暴露的筛查质量改进项目在跨机构转化时取得了成功,但其仅限于肾毒性诱导的AKI,并且明确排除了重症患者。开发和验证用于重症儿童的复杂AKI预测模型的一个关键障碍是缺乏足够精细的多中心数据集。质量改进和管理数据集,如虚拟儿科系统(VPS)和儿科健康信息系统,虽然量大且标准化,但对于AKI等复杂疾病的模型训练而言不够精细。此外,这些数据集在患者出院时完成,而设计用于实施的预测模型必须仅依赖于进行预测时可获得的数据。大型成人重症监护数据集(如重症监护医学信息市场III和电子ICU协作研究数据库)促进了机器学习(ML)算法的开发和验证,并成为众多成人AKI预测模型的基础,但儿科重症监护领域尚无类似的数据集。在本研究中,研究人员利用两个由协调化的EHR数据组成的新的精细多机构数据集,来验证和更新一个用于预测早期AKI的现有模型。该初步模型在单中心数据上表现出尚可的性能,但仅在单中心数据上训练和评估。研究人员聚焦于在活体EHR中实施的可行性,对该现有模型进行了更新和验证,旨在通过精确率和召回率来衡量以提高预测性能。开发和外部验证这一更新后的模型是将其前瞻性应用于现实世界的重要一步,有助于临床医生通过已验证的干预和预防策略(如优化液体平衡、肾脏灌注和其他可调节的AKI风险因素)减轻该人群的AKI负担。研究使用了两个多中心数据集:通过概率链接创建的PEDSNET-VPS数据集(包含来自六个机构的数据,时间跨度超过6年,最新数据为2017年)和PICU数据协作组(PDC)数据集(包含八个机构的数据,提交的时间范围为2-11年,多数提交至少8年的数据,包含截至2022年的入院记录)。研究人员采用了基于时间的采样将每个数据集分为训练集、验证集和测试集。AKI定义基于改善全球肾脏病预后组织(KDIGO)分期标准,使用血清肌酐(SCr)。在对现有单中心模型进行再校准后,研究人员发现其在两个多中心数据集中的区分度中等至较差(AUROC: 0.65-0.78)。随后,通过迭代特征选择和模型重新训练(使用入住ICU 12小时内可获得的特征),并在验证数据中调整模型超参数,最终选择了逻辑回归模型。在测试集中,更新后的模型在PEDSNET-VPS数据集的AUROC为0.80,在PDC数据集为0.88;AUPRC分别为0.13和0.22。对预测评分贡献最大的特征包括入住12小时时的血钙、乳酸、肌酐和平均收缩压。在讨论中,研究人员指出这是首次使用两个新的多中心儿科重症监护数据集来评估、再校准、扩展和验证基于机器学习的早期新发AKI预测算法。与初始单中心验证相比,现有单中心模型在多中心数据上表现出较差的区分度和性能。添加预测时可获得的新特征后,性能得到提升。模型开发聚焦于可实施性,选择了入住12小时时普遍可获得的特征,并以平衡敏感度和阳性预测值(PPV)为目标。与其他预测AKI的风险评分(如RAI)相比,本研究模型更注重数据驱动的、在真实EHR环境中可部署的特性。多中心验证对于模型在原始开发机构外的泛化至关重要。本研究通过使用旨在支持机器学习开发和验证的全新多中心数据集,证明了相比再校准单中心模型,性能有所改善。模型设计和特征选择聚焦于实施,平衡敏感度和PPV以识别新发早期AKI风险患者,同时平衡对临床医生的警报负荷。局限性包括部分数据集(PEDSNET-VPS)因缺失数据排除了大量受试者且数据不包含2017年后的信息,两个数据集均缺乏协调化的出入量数据、血管活性药物连续输注数据以及机械通气数据。研究结论为,在首次使用两个专为机器学习开发和验证设计的新多中心数据集的研究中,相比再校准单中心模型,更新模型的区分度和性能得到提升。研究人员设计模型并选择特征是为了实施,平衡敏感度和PPV,以同时捕获新发早期AKI风险患者并平衡对临床医生的警报负荷。未来的工作包括在重症监护环境中进行前瞻性的隐式验证,以及通过添加新的时间和特定地点的数据来持续改进模型。

生物通微信公众号
微信
新浪微博


生物通 版权所有