编辑推荐:
摘要尽管大型语言模型在诊断对话方面展现出潜力1,但其在有效管理推理方面的能力——包括疾病进展、治疗反应以及安全用药处方——仍需进一步研究。我们通过一种基于新大型语言模型的智能系统,提升了Articulate Medical Intelligence Explorer(AMIE)原
尽管大型语言模型在诊断对话方面展现出潜力1,但其在有效管理推理方面的能力——包括疾病进展、治疗反应以及安全用药处方——仍需进一步研究。我们通过一种基于新大型语言模型的智能系统,提升了Articulate Medical Intelligence Explorer(AMIE)原有的诊断能力1−3,该系统专为多次就诊的临床管理和对话优化设计。为确保其推理基于权威的临床知识,AMIE利用了Gemini的长上下文处理能力4,结合上下文检索与结构化推理,使其输出符合最新的临床实践指南和药品说明书。在一项随机、盲法进行的虚拟客观结构化临床考试研究中,AMIE与21名全科医生在100个模拟多次就诊的病例场景中进行了对比,这些场景是根据英国NICE指南和BMJ最佳实践指南设计的。经专家评估,AMIE在管理推理方面不逊于全科医生,且在治疗方案和检查的准确性以及与临床指南的契合度方面表现更优。为评估用药推理能力,我们开发了RxQA这一多项选择题测试工具,其题目来自美国和英国的两份国家药品说明书,并经过认证药师验证。虽然AMIE和全科医生都能从外部药品信息中获益,但在难度较高的题目上,AMIE的表现更佳。尽管在实际应用之前还需进一步研究,但AMIE在各项评估中的优异表现,标志着对话式人工智能在疾病管理领域迈出了重要一步。
生物通 版权所有