**背景:** 在代谢减重手术(Metabolic Bariatric Surgery, MBS)中,有效的沟通对于患者参与和术后依从至关重要,然而外科住院医师往往缺乏结构化的沟通训练。人工智能(Artificial Intelligence, AI)为培养此类技能提供了一种新途径。**目的:** 评估与自主学习相比,一种AI引导的认知框架VALUE(Validate, Align & Reframe, Link & Educate, Unite in a plan)对MBS咨询中共享决策(Shared Decision-Making, SDM)及沟通结局的影响。**方法:** 将40名外科住院医师随机分为两组:AI引导组(使用VALUE框架)和自主学习组。AI引导组使用结构化提示与大型语言模型(DeepSeek-V3.2)交互以生成个性化咨询计划。每位医师在案例库中与标准化病人(Standardized Patients, SPs)进行模拟咨询。结局通过共享决策问卷-9(SDM-Q-9)、决策冲突量表(Decision Conflict Scale, DCS)、四习惯编码方案(Four Habits Coding Scheme, 4HCS)、外科医师自我效能感量表(Surgeon Self-Efficacy Scale, SSI-BS)、沟通提纲质量量表(Communication Outline Quality Scale, CQS)和AI交互质量量表(AI Interaction Quality, AIIQ)进行测量。该试验在开放科学框架(Open Science Framework)注册(注册号:https://doi.org/10.17605/OSF.IO/BAQH6)。**结果:** AI引导组在SDM-Q-9(84.7 vs. 71.3, p < 0.01)和4HCS(17.5 vs. 14.8, p < 0.01)上得分显著更高,在DCS(19.5 vs. 32.1, p < 0.01)上得分显著更低。其沟通提纲质量也更高(13.8 vs. 7.5, p < 0.01)。住院医师报告在信息提供、价值观整合、决策促进和情感支持方面获得了更大的自我效能感提升。在经Benjamini-Hochberg多重比较校正后,所有次要分析结果仍保持显著性。**结论:** 一种AI引导的认知沟通框架能显著提升MBS咨询中的共享决策水平、降低决策冲突,并改善沟通质量和自我效能感,这表明了一种有前景的方法,但仍需在更大规模、多中心的试验中进一步验证。
**论文解读**
代谢减重手术(Metabolic Bariatric Surgery, MBS)是治疗重度肥胖及其相关疾病最有效的干预措施之一,能带来持久的体重反弹预防、糖尿病缓解和死亡率降低。然而,其最佳临床反应远不止于手术室内的技术精通;它在很大程度上依赖于术前咨询的质量。这次谈话必须处理复杂的医学权衡,与患者深层的人生目标(如生育或职业抱负)保持一致,并建立终身术后合作所需的信任。但在我们的医疗体系中,这里存在一个关键的脆弱点:外科专业知识与决策制定之间的沟通鸿沟。外科住院医师虽然擅长学习手术操作,但往往在接受处理这些复杂的、涉及价值观的对话方面训练不足。他们面对的患者可能从社交媒体收集了误导信息、对手术风险感到恐惧,或仅仅关注于外貌改善。主要挑战不仅是分享医学事实,更是帮助每位患者理解这些事实如何适用于他们自己的生活,同时解决他们的恐惧、优先事项和个人目标。传统教学方法几乎无助于培养这种高级技能,导致住院医师准备不足。其结果显而易见:决策不佳、长期随访准备薄弱,最终可能导致患者不满意或体重反弹。
人工智能(Artificial Intelligence, AI),特别是大型语言模型,正在催化医学教育和临床支持的变革,从单纯的知识检索转向复杂的推理和沟通指导。在面向患者的情境中,AI驱动的工具在提升术前教育和术后支持方面展现出潜力。然而,存在一个重大且未充分探索的机会:不是将AI作为面向患者的聊天机器人,而是将其作为临床医师在咨询规划阶段(即共同理解被构建的关键窗口期)的一种认知脚手架。本研究认为,有效的MBS沟通是一项可学习的临床技能,可以被分解、练习和强化。基于动机性访谈、共享决策(Shared Decision-Making, SDM)和认知重构的既定原则,研究人员开发了VALUE框架(Validate, Align & Reframe, Link & Educate, Unite in a plan)——一种结构化的、顺序性的方法。本研究旨在探究,与传统的自主学习相比,围绕此认知框架进行的AI引导交互,是否能显著提升外科住院医师的沟通表现,并衡量其对咨询可观察质量、患者SDM体验以及决策冲突降低的影响。
研究人员开展了一项前瞻性、随机、对照的教育试验,于2025年8月至12月进行。研究方案经机构审查委员会批准,并在开放科学框架(Open Science Framework)前瞻注册。试验招募了来自单一学术医学中心外科(具备认证MBS项目)的40名外科住院医师(研究生培训年级PGY 1-5),采用计算机生成的随机数进行1:1分配,分为AI引导组(n=20)和自主学习组(n=20),并按PGY级别分层以确保组间平衡。AI引导组使用结构化提示与大型语言模型(DeepSeek-V3.2)交互,为案例库中的标准化病人(Standardized Patients, SPs)生成个性化的咨询提纲。自主学习组则使用允许的任何资源(如教科书、指南)进行准备。每位住院医师随后与两名SPs进行两次15分钟的模拟咨询,咨询过程录像。主要结局为患者报告的共享决策问卷-9(SDM-Q-9)评分(0-100分)。次要结局包括决策冲突量表(DCS)评分、经盲法评估者评分的四习惯编码方案(4HCS)评分、外科医师自我效能感量表(SSI-BS)变化分,以及沟通提纲质量量表(CQS)评分。数据分析采用意向性治疗原则,使用独立样本t检验和协方差分析(ANCOVA),并应用Benjamini-Hochberg错误发现率(FDR)校正多重比较。
**研究结果**
**参与者流程与基线特征:** 共评估44名外科住院医师,40名被随机分组,全部完成研究。两组在年龄、性别、培训级别、既往MBS临床暴露时间等基线特征上均衡(所有p > 0.05)。
**主要结局:共享决策水平:** 患者报告的SDM-Q-9评分,AI引导组显著高于自主学习组(84.7 ± 7.1 vs. 71.3 ± 9.8;均数差13.4,95% CI 9.6至17.2,p < 0.01;Cohen’s d = 1.42)。该差异超过了10分的最小临床重要差异(MCID),具有临床意义。协方差分析(ANCOVA)调整PGY级别和基线SSI-BS后,组间效应仍高度显著(F = 28.4,p < 0.001)。
**沟通表现:** AI引导组在4HCS总分上显著更高(17.5 ± 1.7 vs. 14.8 ± 2.2;p < 0.01;d = 1.23)。尤其在习惯2(引出患者观点)和习惯4(投资于结局)方面表现出显著优势。
**决策冲突:** AI引导组在DCS总分上显著更低(19.5 ± 9.0 vs. 32.1 ± 11.5;p < 0.01;d = -1.14),降低幅度超过10分的MCID。在“信息”和“价值观清晰度”两个分量表上的降低最为显著。
**外科医师自我效能感:** AI引导组在SSI-BS总分变化上显著更高(+3.5 ± 1.3 vs. +1.8 ± 1.7;p < 0.01;d = 1.00),尤其在价值观整合和决策促进领域改善最大。
**过程评估:** AI引导组准备的咨询提纲在沟通提纲质量量表(CQS)上得分显著更高(13.8 ± 1.6 vs. 7.5 ± 2.3;p < 0.01;d = 2.52),在结构、价值观整合和语言适当性方面尤为突出。AI交互质量良好,平均分10.8 ± 1.3(满分13)。探索性中介分析表明,提纲质量(CQS)部分中介了分组对SDM-Q-9的效应。
**讨论与结论**
本研究表明,一种结构化的AI引导认知框架(VALUE)能显著提升外科住院医师进行MBS咨询的质量。干预措施在以临床医师为中心和基于过程的结局指标上产生了具有大效应量的初步积极结果。最重要的是,当与使用AI引导准备工作的住院医师互动时,标准化病人感知到的共享决策程度显著提高,这体现在主要结局(SDM-Q-9)大幅增加13.4分,效应量大(d = 1.42)。同时,标准化病人经历的决策冲突显著减少,尤其在理解信息和个人价值观清晰度方面。这些患者报告的结局直接反映在沟通行为上:盲法评估者对AI引导组咨询的沟通评分(4HCS)显著更高,最显著的改善体现在引出患者观点和投资于结局这两个习惯上。关键的是,这不仅仅是表现提升;干预组的住院医师报告了在整合患者价值观和促进复杂决策等关键沟通任务上自我效能感的更大提升。过程评估揭示了这些改善的机制:AI引导的VALUE框架使住院医师能够准备出质量显著更高的咨询提纲,这些提纲具有战略结构并与患者特定价值观深度整合,有效地将准备转化为卓越的咨询表现。
这一干预的成功关键在于AI应用模式的刻意转变:从信息来源转变为专家认知过程的脚手架。研究人员并非部署AI来与患者交谈或生成静态脚本,而是利用它通过结构化的VALUE(验证、关联、链接、联合)序列来引导临床医师的准备性推理。这种方法将专家临床医师的隐性、通常混乱的认知工作流程外化为一个可复制、可学习的模型。AI充当了认知伙伴,促使住院医师首先验证患者的观点,然后明确一个共同的、更高层次的目标(例如“实现最佳的妊娠准备状态”,而不是“选择袖状胃切除术还是胃旁路术”),再将医学证据与该目标联系起来。这个过程迫使基于价值观对临床数据进行重新框架化。结果,如优于对照组的咨询提纲和沟通习惯所示,咨询从一种数据输出的独白转变为一种目标一致的、协作性的对话。
该研究将AI的定位创新性地设定为临床医师在会面前认知和沟通过程的教练。提纲准备质量(CQS得分差异5.8分)的显著改善突显了改善咨询计划架构是一个强大且先前未被充分利用的干预点。这种“与AI一起准备”的模型补充了现有的“与SPs一起练习”的范式,创造了一个更全面的学习循环。
尽管取得了这些有希望的成果,本研究仍存在多项局限性,包括样本量较小、效应量可能因小样本偏差和共同方法变异而高张、结果基于模拟咨询而非真实临床场景、仅评估了短期表现而未进行延迟评估以评估技能留存、特定AI模型和框架的泛化性未知、参与者未设盲可能引入性能偏差,以及单中心设计限制了结果的普适性。因此,这些发现应被视为生成假设的初步证据。
最终结论:本研究发现表明,AI引导的VALUE框架是一种有前景的、生成假设的策略,有望改善MBS咨询中的共享决策。通过为临床医师的准备性推理提供脚手架,该干预在患者感知的合作度、决策冲突、观察到的沟通技能和外科医师自我效能感方面产生了令人鼓舞的初步改善。然而,在做出任何有效性声称之前,需要在更大规模、多中心、预注册的试验中进行独立重复验证,这些试验应包含延迟结局评估,并且采用与干预结构不对应的测量工具。这种“与AI一起准备”的模型目前应被视为一种值得进一步研究的生成假设的方法。
打赏