编辑推荐:
生成式AI在医学教育中的应用尚存验证不足,主要集中于皮肤科、眼科和解剖学,存在医学准确性低、任务准确率不足(如心电图32.7%)、评估标准不统一及性别偏见等问题,建议作为实验性工具并加强偏见审核与教育理论结合。
生成式人工智能(AI)能够创建合成医学图像,从而开启新的教育应用,但目前的相关工具在教育准确性、安全性或公平性方面尚未经过系统性的验证。本综述探讨了生成式AI系统在健康专业教育中用于医学图像创建的方式,总结了已报道的益处和风险,并指出了证据上的空白。通过对PubMed、Embase、Scopus以及灰色文献(2010年1月至2025年5月)的检索,共找到了19项符合研究标准的研究。近期研究中,扩散模型(如Stable Diffusion、DALL-E、Midjourney)占据了主导地位,其应用主要集中在皮肤科、眼科和解剖学领域;而放射学和病理学领域的应用则相对较少。一些研究(包括小型对照试验)报告称学习者的表现或参与度有所提升,但研究设计、结果测量方法及随访时间存在较大差异。在整个文献中,一些常见的问题包括:医学信息不准确或解剖结构不符合实际(包括出现幻觉性结构)、某些领域的任务准确率极低(例如,合成心电图的准确率仅为32.7%)、评估指标不一致以及外部验证不足。此外,多项研究还发现生成图像存在人口统计偏见和刻板印象,这表明如果不加批判地使用生成式AI,反而可能加剧而非解决多样性和代表性问题。总体而言,应将生成式AI用于图像创建视为一种实验性辅助工具,需要严格的人类参与反馈机制、偏见审核以及与教育理论的一致性评估。未来的研究应采用标准化的合成图像评估框架(如准确性和认知负荷考量),进行研究质量评估,并测试长期的学习迁移效果和临床影响。
生成式人工智能(AI)能够创建合成医学图像,从而开启新的教育应用,但目前的相关工具在教育准确性、安全性或公平性方面尚未经过系统性的验证。本综述探讨了生成式AI系统在健康专业教育中用于医学图像创建的方式,总结了已报道的益处和风险,并指出了证据上的空白。通过对PubMed、Embase、Scopus以及灰色文献(2010年1月至2025年5月)的检索,共找到了19项符合研究标准的研究。近期研究中,扩散模型(如Stable Diffusion、DALL-E、Midjourney)占据了主导地位,其应用主要集中在皮肤科、眼科和解剖学领域;而放射学和病理学领域的应用则相对较少。一些研究(包括小型对照试验)报告称学习者的表现或参与度有所提升,但研究设计、结果测量方法及随访时间存在较大差异。在整个文献中,一些常见的问题包括:医学信息不准确或解剖结构不符合实际(包括出现幻觉性结构)、某些领域的任务准确率极低(例如,合成心电图的准确率仅为32.7%)、评估指标不一致以及外部验证不足。此外,多项研究还发现生成图像存在人口统计偏见和刻板印象,这表明如果不加批判地使用生成式AI,反而可能加剧而非解决多样性和代表性问题。总体而言,应将生成式AI用于图像创建视为一种实验性辅助工具,需要严格的人类参与反馈机制、偏见审核以及与教育理论的一致性评估。未来的研究应采用标准化的合成图像评估框架(如准确性和认知负荷考量),进行研究质量评估,并测试长期的学习迁移效果和临床影响。
生物通 版权所有