人工智能将彻底改变外科手术的决策过程，这一变革还只是指日可待

时间：2026年5月25日

来源：Surgery

编辑推荐：

塞莱娜·K·张 | 亚当·罗德曼哈佛医学院，马萨诸塞州波士顿摘要医学人工智能（AI），尤其是大型语言模型（LLMs），在医学界引发了既兴奋又担忧的情绪。它有望提高手术诊断的准确性、围手术期的决策能力以及患者安全，但同时也存在偏见问题，以及对人类专业技能未来发展的影响。AI临床决策

塞莱娜·K·张 | 亚当·罗德曼

哈佛医学院，马萨诸塞州波士顿

摘要

医学人工智能（AI），尤其是大型语言模型（LLMs），在医学界引发了既兴奋又担忧的情绪。它有望提高手术诊断的准确性、围手术期的决策能力以及患者安全，但同时也存在偏见问题，以及对人类专业技能未来发展的影响。AI临床决策支持（CDS）的演变始于外科领域，早期的系统如AAPHelp就利用贝叶斯推理来诊断急性腹痛。尽管AI CDS最初展现出巨大潜力，但在20世纪80年代，开发更强大的诊断工具的努力大多未能取得成功：这些工具无法充分诊断和管理复杂病例，其决策过程缺乏透明度，且应用范围也有限。直到21世纪10年代，随着机器学习（ML）技术的进步和大规模临床数据集的普及，CDS才开始在外科实践中展现出新的潜力。如今，新的AI模型，尤其是基于LLMs的模型，已经展示了令人印象深刻的能力，从预测个体患者的术后并发症风险到简化临床文档处理等。然而，在透明度、偏见、可靠性以及与临床工作流程的整合方面仍存在挑战。尽管存在这些障碍，基于AI的工具（如LLMs）仍然代表了外科决策领域的一个令人兴奋的新篇章。这些技术建立在长期的外科CDS系统基础上，有望显著提升外科实践并改善患者护理。

章节摘录

早期外科临床决策支持

可以说，外科领域率先提出了AI临床决策支持（CDS）的概念。20世纪70年代，De Dombal等人开发了AAPHelp，该系统利用贝叶斯推理来诊断急性腹痛。¹该系统的诊断准确性远高于人类外科医生，在一项随机对照试验中，使用该系统后患者的手术与非手术管理效果有所改善。试验期间，临床医生的诊断准确性也有所提高，但他们的表现

机器学习在外科CDS中的应用

与早期基于贝叶斯或专家系统的不同，ML算法能够处理大量数据，并在做出非程序化预测之前学习复杂模式。这开启了外科领域风险预测和围手术期支持工具的新时代。例如MySurgeryRisk模型，通过对超过50,000名患者的数据进行训练，能够准确预测个体患者的术后并发症风险。⁴

大型语言模型在外科CDS中的应用

LLMs是驱动ChatGPT（OpenAI）或Gemini（Google）等流行聊天机器人的ML模型，它们通过庞大的文本数据库进行训练，能够处理自然语言查询并生成详细回复。从根本上说，LLMs通过预测句子中的下一个词来工作，类似于自动完成算法。然而，它们的规模、处理能力以及“注意力”机制赋予了它们类似人类的决策能力。最近在运行时推理方面的创新

外科CDS面临的挑战与未来

总之，基于AI的工具（如LLMs）代表了外科决策和护理领域的一个令人兴奋的新篇章，它们建立在长期的外科CDS系统基础上。虽然透明度、偏见和可靠性方面的挑战依然存在，但这些支持系统的持续发展凸显了AI作为临床专业技能重要补充的价值。尽管人们对这些技术存在一定的炒作和担忧，但最好将其视为持续进化的一部分