利用机器学习和大型语言模型预测急诊科患者的处理方式，以支持主动的容量管理：一项多中心回顾性研究

时间：2026年2月24日

来源：BMC Emergency Medicine

编辑推荐：

急诊科患者入院/出院预测模型研究：基于EHR与LLM提取特征的机器学习模型构建及验证。在11家南卡罗来纳急诊部门2023-2024年998,109次就诊数据中，整合传统结构化EHR数据（人口学特征、生命体征等）和LLM提取的triage笔记特征（如转诊记录），采用CatBoost/XGBoost/LightGBM等九种分类器，通过平衡处理（AUROC达0.89，召回率>0.83）验证模型有效性。SHAP分析显示关键预测因子包括triage急性度、转诊来源、主诉、年龄及到达方式。模型为高需求时期床位分配和人员调度提供决策支持。

摘要

背景

急诊科（ED）的拥挤情况和患者候诊时间的延长仍然是急性护理领域的主要挑战。我们的目标是利用常规可用的电子健康记录（EHR）数据以及从分诊记录中提取的特征，并结合大型语言模型（LLMs），开发和验证机器学习（ML）模型，以在医生评估之前预测患者的去向（住院或出院），从而在高需求和患者激增的情况下支持主动的住院床位管理和人员配备准备。

方法

这项回顾性研究分析了南卡罗来纳州一个区域医疗系统内11个急诊科在2023年1月至2024年11月期间的998,109次就诊记录。在医生评估之前可获得的预测因素包括人口统计信息、就诊特征、生命体征、工作流程变量以及由LLMs提取的特征。共训练了9种分类器，其中有些分类器进行了类别平衡处理，以应对较低的住院率；还有一些分类器使用了LLMs提取的特征。模型性能通过接收者操作特征曲线下面积（AUROC）、精确度-召回率曲线下面积（AUPRC）、召回率、精确度、F1分数和准确率等指标进行评估，同时使用Shapley加性解释（SHAP）分析来确定具有影响力的预测因素。

结果

平衡后的模型表现优于不平衡的模型。表现最好的模型（CatBoost、XGBoost、LightGBM）的AUROC值为0.89，召回率超过0.83，准确率为0.79。加入LLMs提取的特征后，模型性能进一步提高，主要体现在提升了召回率，并使“由其他临床医生转诊”等特征成为重要预测因素。其他关键预测因素还包括分诊紧急程度、就诊医院、主诉、年龄和就诊方式。