今日动态
  • 生物通首页
  • 今日动态
  • 新技术专栏
  • 人才市场

生物通首页 > 今日动态 > 正文

何时保持沉默更安全:面向医疗领域大型语言模型回避行为的综述与决策理论框架

时间:2026年6月17日
来源:npj Digital Medicine

编辑推荐:

摘要大型语言模型旨在为用户的问题生成答案,这往往使它们在存在高度不确定性、信息不完整或应当拒绝回应时仍会给出答复。在医疗领域,这种倾向可能十分危险:错误但看似可靠的医疗建议可能会造成严重危害,因此具备拒绝回应的能力尤为重要。本文综述了有关大型语言模型在医疗场景中拒绝回应行为的研究

广告
   X   

摘要

大型语言模型旨在为用户的问题生成答案,这往往使它们在存在高度不确定性、信息不完整或应当拒绝回应时仍会给出答复。在医疗领域,这种倾向可能十分危险:错误但看似可靠的医疗建议可能会造成严重危害,因此具备拒绝回应的能力尤为重要。本文综述了有关大型语言模型在医疗场景中拒绝回应行为的研究。现有研究主要指出两种动机:一是基于不确定性的拒绝,即当模型对答案的置信度较低时会选择不回应;二是基于安全考虑的拒绝,即模型会避免提供可能有害的信息。目前大多数相关机制都是外在的,依赖辅助工具来决定何时拒绝回应。我们发现,最先进的大型语言模型仍然难以拒绝不合适的请求,而且很少有评估标准是在真实的医疗场景下测试拒绝行为的,这类场景下的模型表现往往不如其他领域。基于这些发现,我们提出了一种基于决策理论的拒绝行为建模方法,用于分析在存在不确定性及潜在危害时回应与不回应之间的权衡。以此为基础,我们设计了MedSAFE框架,用于评估临床对话中的拒绝行为,并通过基于现有研究案例设计的概念验证试验展示了该框架的实际应用效果。

First slide
引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>
First slide
揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>
First slide
对同一细胞中的转录组和表观基因组进行同时分析(使用细胞核分离试剂盒简化样本制备工作流程)>>
First slide
「大小鼠繁育与健康管理」指导海报,点击即可免费领取电子版或实体海报>>
Previous Next
热点排行
  • 1靶向细胞衰老-自噬轴通过抑制p16INK4a缓解肺纤维化
  • 2多组学揭示1型糖尿病年龄相关内型中微生物群、代谢物及免疫学的异质性
  • 3终末回肠活检的单细胞RNA测序鉴定克罗恩病发病机制特征
  • 4细胞衰老的血浆蛋白质组学特征预测人类疾病
  • 5活动依赖性自适应深部脑刺激改善帕金森病患者的步态
  • 6基于mRNA的流感疫苗可拓展人类B细胞应答广度
  • 7一种用于整体性研究上皮-间质转化的人诱导多能干细胞模型
  • 8靶向角膜施万细胞(Corneal Schwann Cells, cSCs)中DKK1促进角膜损伤后轴突再生与机械感觉功能恢复
  • 9皮层内脑机接口(BCI)用于言语和光标控制的长期独立使用
  • 10综述:肥胖与癌症:流行病学、机制及未来展望
生物通微信公众号
生物通新浪微博
在线客服
微信
新浪微博
我要投稿

返回顶部


生物通 版权所有

订阅Biohot解锁原文链接索取