人工智能将彻底改变外科手术的决策过程,这一变革还只是指日可待

时间:2026年5月25日
来源:Surgery

编辑推荐:

塞莱娜·K·张 | 亚当·罗德曼哈佛医学院,马萨诸塞州波士顿摘要医学人工智能(AI),尤其是大型语言模型(LLMs),在医学界引发了既兴奋又担忧的情绪。它有望提高手术诊断的准确性、围手术期的决策能力以及患者安全,但同时也存在偏见问题,以及对人类专业技能未来发展的影响。AI临床决策

广告
   X   

塞莱娜·K·张 | 亚当·罗德曼
哈佛医学院,马萨诸塞州波士顿

摘要

医学人工智能(AI),尤其是大型语言模型(LLMs),在医学界引发了既兴奋又担忧的情绪。它有望提高手术诊断的准确性、围手术期的决策能力以及患者安全,但同时也存在偏见问题,以及对人类专业技能未来发展的影响。AI临床决策支持(CDS)的演变始于外科领域,早期的系统如AAPHelp就利用贝叶斯推理来诊断急性腹痛。尽管AI CDS最初展现出巨大潜力,但在20世纪80年代,开发更强大的诊断工具的努力大多未能取得成功:这些工具无法充分诊断和管理复杂病例,其决策过程缺乏透明度,且应用范围也有限。直到21世纪10年代,随着机器学习(ML)技术的进步和大规模临床数据集的普及,CDS才开始在外科实践中展现出新的潜力。如今,新的AI模型,尤其是基于LLMs的模型,已经展示了令人印象深刻的能力,从预测个体患者的术后并发症风险到简化临床文档处理等。然而,在透明度、偏见、可靠性以及与临床工作流程的整合方面仍存在挑战。尽管存在这些障碍,基于AI的工具(如LLMs)仍然代表了外科决策领域的一个令人兴奋的新篇章。这些技术建立在长期的外科CDS系统基础上,有望显著提升外科实践并改善患者护理。

章节摘录

早期外科临床决策支持

可以说,外科领域率先提出了AI临床决策支持(CDS)的概念。20世纪70年代,De Dombal等人开发了AAPHelp,该系统利用贝叶斯推理来诊断急性腹痛。1该系统的诊断准确性远高于人类外科医生,在一项随机对照试验中,使用该系统后患者的手术与非手术管理效果有所改善。试验期间,临床医生的诊断准确性也有所提高,但他们的表现

机器学习在外科CDS中的应用

与早期基于贝叶斯或专家系统的不同,ML算法能够处理大量数据,并在做出非程序化预测之前学习复杂模式。这开启了外科领域风险预测和围手术期支持工具的新时代。例如MySurgeryRisk模型,通过对超过50,000名患者的数据进行训练,能够准确预测个体患者的术后并发症风险。4

大型语言模型在外科CDS中的应用

LLMs是驱动ChatGPT(OpenAI)或Gemini(Google)等流行聊天机器人的ML模型,它们通过庞大的文本数据库进行训练,能够处理自然语言查询并生成详细回复。从根本上说,LLMs通过预测句子中的下一个词来工作,类似于自动完成算法。然而,它们的规模、处理能力以及“注意力”机制赋予了它们类似人类的决策能力。最近在运行时推理方面的创新

外科CDS面临的挑战与未来

总之,基于AI的工具(如LLMs)代表了外科决策和护理领域的一个令人兴奋的新篇章,它们建立在长期的外科CDS系统基础上。虽然透明度、偏见和可靠性方面的挑战依然存在,但这些支持系统的持续发展凸显了AI作为临床专业技能重要补充的价值。尽管人们对这些技术存在一定的炒作和担忧,但最好将其视为持续进化的一部分

致谢与披露

利益冲突/披露:亚当·罗德曼博士报告称自己在谷歌担任访问研究员。
利益冲突/披露:塞莱娜·张没有财务披露。

资金/支持

亚当·罗德曼博士报告获得了NIH、Gordon and Betty Moore基金会、Josiah Macy基金会以及谷歌的资助。不过,作者本人并未为此项工作获得任何资金。

CRediT作者贡献声明

塞莱娜·K·张:撰写 – 审稿与编辑、初稿撰写、数据整理、概念构思。亚当·罗德曼:撰写 – 审稿与编辑、初稿撰写、监督、数据整理、概念构思。

生物通微信公众号
微信
新浪微博


生物通 版权所有