今日动态
  • 生物通首页
  • 今日动态
  • 新技术专栏
  • 人才市场

生物通首页 > 今日动态 > 正文

大型语言模型(LLM)生成的新生儿复苏模拟的可行性与挑战:一项多中心探索性研究

时间:2026年5月26日
来源:Scandinavian Journal of Trauma, Resuscitation and Emergency Medicine

编辑推荐:

摘要背景基于模拟的培训(SBT)在新生儿复苏中具有积极的教育效果和新生儿预后改善作用。然而,实施设计良好的SBT对培训师提出了多方面的要求。大型语言模型(LLMs)在动态生成情境化的复苏场景方面可能具有潜力。但目前尚存在关于LLM生成的模拟场景在新生儿复苏中的可行性和挑战的疑问。

广告
   X   

摘要

背景

基于模拟的培训(SBT)在新生儿复苏中具有积极的教育效果和新生儿预后改善作用。然而,实施设计良好的SBT对培训师提出了多方面的要求。大型语言模型(LLMs)在动态生成情境化的复苏场景方面可能具有潜力。但目前尚存在关于LLM生成的模拟场景在新生儿复苏中的可行性和挑战的疑问。

方法

这是一项前瞻性、多中心的研究,旨在评估LLM生成的模拟场景的可行性和挑战。通过ChatGPT-4o和DeepSeek-R1生成了四个场景,包括极早产儿、胎盘早剥、出生前到达医院以及羊水被胎粪污染的情况。同时从Neonatal Resuscitation Program®(NRP®)和RETAIN(一个严肃游戏平台)中提取了四个类似的场景。这16个场景均按照标准化模板编写、编码并随机化。来自5个中心的9位独立培训师在不知道场景来源(ChatGPT、DeepSeek、NRP®或RETAIN)的情况下,使用修改后的Jeffries模拟设计量表(JSDS)对场景的表现进行了评估。此外,还比较了四组之间的AI幻觉现象和定性评估结果。

结果

与NRP®场景相比,ChatGPT生成的场景在总体评估中表现出相当的中位分数,没有统计学上的显著差异;而DeepSeek和RETAIN在总体评估、问题解决效果和场景真实性方面得分较低。DeepSeek在提供适当信息方面的表现较差。在反馈设计方面,ChatGPT的得分高于NRP®(效应量 r = 0.25,P = 0.02)。两种LLM之间的AI幻觉现象没有统计学差异。ChatGPT在明确目标并提供结构化反馈框架方面表现出优势,但在持续提供动态生命体征数据方面存在不足。DeepSeek则出现了与NRP®算法不符的情况。

结论

在NRP®培训师的监督下,ChatGPT生成的模拟场景可能有助于促进SBT的实施。LLM生成的场景仍存在与NRP®的偏差和不足,因此在实际应用前需要进行客观评估。进一步研究教育效果和目标学习者的反馈对于将LLM生成的模拟场景适当整合到SBT中至关重要。

临床试验编号

不适用。

背景

基于模拟的培训(SBT)在新生儿复苏中具有积极的教育效果和新生儿预后改善作用。然而,实施设计良好的SBT对培训师提出了多方面的要求。大型语言模型(LLMs)在动态生成情境化的复苏场景方面可能具有潜力。但目前尚存在关于LLM生成的模拟场景在新生儿复苏中的可行性和挑战的疑问。

方法

这是一项前瞻性、多中心的研究,旨在评估LLM生成的模拟场景的可行性和挑战。通过ChatGPT-4o和DeepSeek-R1生成了四个场景,包括极早产儿、胎盘早剥、出生前到达医院以及羊水被胎粪污染的情况。同时从Neonatal Resuscitation Program®(NRP®)和RETAIN(一个严肃游戏平台)中提取了四个类似的场景。这16个场景均按照标准化模板编写、编码并随机化。来自5个中心的9位独立培训师在不知道场景来源(ChatGPT、DeepSeek、NRP®或RETAIN)的情况下,使用修改后的Jeffries模拟设计量表(JSDS)对场景的表现进行了评估。此外,还比较了四组之间的AI幻觉现象和定性评估结果。

结果

与NRP®场景相比,ChatGPT生成的场景在总体评估中表现出相当的中位分数,没有统计学上的显著差异;而DeepSeek和RETAIN在总体评估、问题解决效果和场景真实性方面得分较低。DeepSeek在提供适当信息方面的表现较差。在反馈设计方面,ChatGPT的得分高于NRP®(效应量 r = 0.25,P = 0.02)。两种LLM之间的AI幻觉现象没有统计学差异。ChatGPT在明确目标并提供结构化反馈框架方面表现出优势,但在持续提供动态生命体征数据方面存在不足。DeepSeek则出现了与NRP®算法不符的情况。

结论

在NRP®培训师的监督下,ChatGPT生成的模拟场景可能有助于促进SBT的实施。LLM生成的场景仍存在与NRP®的偏差和不足,因此在实际应用前需要进行客观评估。进一步研究教育效果和目标学习者的反馈对于将LLM生成的模拟场景适当整合到SBT中至关重要。

临床试验编号

不适用。

First slide
引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>
First slide
揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>
First slide
对同一细胞中的转录组和表观基因组进行同时分析(使用细胞核分离试剂盒简化样本制备工作流程)>>
First slide
「大小鼠繁育与健康管理」指导海报,点击即可免费领取电子版或实体海报>>
Previous Next
热点排行
  • 1多效共享遗传力量化常见疾病间共享的遗传变异
  • 2人脑膜瘤空间分辨单细胞分析鉴定影响肿瘤微环境与进展的新型细胞状态
  • 3MIXPRS实现基于汇总统计量的多种群和多方法多基因风险评分整合
  • 4佐剂化拉沙病毒糖蛋白复合体(LASSARAB)——以灭活狂犬病毒为载体的拉沙热(Lassa fever)疫苗在健康成人中的Ⅰ期临床试验
  • 5自由活动小鼠皮层各层同步双光子与三光子多平面成像
  • 6OrthoFinder:以提升的准确性和可扩展性改进系统发育直系同源推断
  • 7混合固-液光学(Hybrid Solid−Liquid Optics, HySIL)实现跨多种浸没介质的可扩展高分辨率光片显微镜(Light-Sheet Microscopy, LSM)
  • 8Nature:首次发布果蝇大脑和神经索的连接组
  • 9工程化tRNA在Leber先天性黑矇小鼠模型中减少视力丧失
  • 10特瑞普利单抗联合西妥昔单抗治疗复发或转移性头颈部鳞状细胞癌(R/M HNSCC)的疗效和安全性:一项1b/2期研究
生物通微信公众号
生物通新浪微博
在线客服
微信
新浪微博
我要投稿

返回顶部


生物通 版权所有

订阅Biohot解锁原文链接索取