编辑推荐:
摘要背景目前,越来越多的研究正在探讨生成式人工智能(GenAI)在医学本科生教育中的作用。然而,这些研究的结果存在相当大的差异性。因此,本综述旨在系统地评估GenAI工具在提高医学生的基础知识与临床技能方面的有效性,以与传统教学方法进行比较。方法系统地检索了11个在线数据库(例如
目前,越来越多的研究正在探讨生成式人工智能(GenAI)在医学本科生教育中的作用。然而,这些研究的结果存在相当大的差异性。因此,本综述旨在系统地评估GenAI工具在提高医学生的基础知识与临床技能方面的有效性,以与传统教学方法进行比较。
系统地检索了11个在线数据库(例如Medline、Embase、CINAHL、APA PsycArticle、APA PsycInfo、ERIC、Scopus、CNKI、WanFang Database、VIP和SinoMed),检索时间从研究开始直至2025年10月30日,并更新至2026年4月24日。使用Cochrane偏倚风险工具(ROB 2)和医学教育研究质量工具(MERSQI)进行了风险评估。数据分析使用RevMan 5.3和Stata 15.0软件完成。总体效应通过固定效应模型或随机效应模型进行估计。证据质量评估采用了推荐、评估、发展和评价(GRADE)框架。
这项系统综述和荟萃分析包括了31项研究,涉及2615名医学生。研究发现,GenAI组与对照组在医学知识考试成绩上没有显著差异(效应量较小:n = 1592,P = 0.22,I2 = 92%,SMD = 0.22,95%CI:-0.13至0.56,14项研究,随机效应模型)。然而,护理专业学生在使用GenAI后表现出显著提升(效应量中等:n = 205,P = 0.0002,I2 = 76%,SMD = 1.11,95%CI:0.54至1.69,随机效应模型)。与传统教学方法相比,GenAI并未显著提高医学生的临床技能(效应量较小:n = 726,P = 0.18,I2 = 88%,SMD = 0.27,95%CI:-0.13至0.66,随机效应模型)。通过留一法敏感性分析发现,一项关于精细运动临床技能的研究对结果有显著影响;即当排除该研究后,结果变得具有统计学意义(P = 0.03)。由于方法学质量较差以及结果不一致性,主要结局(医学生的基础知识与临床技能)的证据质量被降级为低水平,而其他证据的质量被评为非常低。
GenAI的教育效益取决于具体情境和领域。其优势主要体现在认知临床技能、学术写作和护理教育方面,而在精细操作技能方面,其与高保真视频教学的比较结果尚不确定。这些发现支持采用差异化整合策略,而非统一采用GenAI。未来仍需要高质量、多中心、大样本和长期的随机对照试验(RCT),以充分验证其对医学生知识获取、临床技能和学术写作表现的影响。
该研究方案已在国际注册系统评价和荟萃分析方案平台(INPLASY)上注册,注册号为INPLASY2025120075。
目前,越来越多的研究正在探讨生成式人工智能(GenAI)在医学本科生教育中的作用。然而,这些研究的结果存在相当大的差异性。因此,本综述旨在系统地评估GenAI工具在提高医学生的基础知识与临床技能方面的有效性,以与传统教学方法进行比较。
系统地检索了11个在线数据库(例如Medline、Embase、CINAHL、APA PsycArticle、APA PsycInfo、ERIC、Scopus、CNKI、WanFang Database、VIP和SinoMed),检索时间从研究开始直至2025年10月30日,并更新至2026年4月24日。使用Cochrane偏倚风险工具(ROB 2)和医学教育研究质量工具(MERSQI)进行了风险评估。数据分析使用RevMan 5.3和Stata 15.0软件完成。总体效应通过固定效应模型或随机效应模型进行估计。证据质量评估采用了推荐、评估、发展和评价(GRADE)框架。
这项系统综述和荟萃分析包括了31项研究,涉及2615名医学生。研究发现,GenAI组与对照组在医学知识考试成绩上没有显著差异(效应量较小:n = 1592,P = 0.22,I2 = 92%,SMD = 0.22,95%CI:-0.13至0.56,14项研究,随机效应模型)。然而,护理专业学生在使用GenAI后表现出显著提升(效应量中等:n = 205,P = 0.0002,I2 = 76%,SMD = 1.11,95%CI:0.54至1.69,随机效应模型)。与传统教学方法相比,GenAI并未显著提高医学生的临床技能(效应量较小:n = 726,P = 0.18,I2 = 88%,SMD = 0.27,95%CI:-0.13至0.66,随机效应模型)。通过留一法敏感性分析发现,一项关于精细运动临床技能的研究对结果有显著影响;即当排除该研究后,结果变得具有统计学意义(P = 0.03)。由于方法学质量较差以及结果不一致性,主要结局(医学生的基础知识与临床技能)的证据质量被降级为低水平,而其他证据的质量被评为非常低。
GenAI的教育效益取决于具体情境和领域。其优势主要体现在认知临床技能、学术写作和护理教育方面,而在精细操作技能方面,其与高保真视频教学的比较结果尚不确定。这些发现支持采用差异化整合策略,而非统一采用GenAI。未来仍需要高质量、多中心、大样本和长期的随机对照试验(RCT),以充分验证其对医学生知识获取、临床技能和学术写作表现的影响。
该研究方案已在国际注册系统评价和荟萃分析方案平台(INPLASY)上注册,注册号为INPLASY2025120075。
生物通 版权所有