利用多模态大规模人工智能框架革新禽流感监测与防控：大语言模型在提升风险沟通、实时决策支持与公共卫生响应策略中的作用

时间：2026年2月14日

来源：One Health

编辑推荐：

为解决禽流感威胁下公共卫生沟通与利益相关者决策的缺口，本研究评估了四种先进大语言模型（LLMs）——ChatGPT-4o、Grok、Gemini 1.5 Pro和DeepSeek R1——在提供准确、情境敏感且符合伦理的指导方面的能力。通过结合结构化查询与情景化小故事的分析，研究发现Gemini 1.5 Pro事实准确性最高（91.2%），各模型在沟通风格与伦理取向上各有侧重。该研究突显了LLMs作为生物监测与风险沟通工具的潜力与局限，强调了将其负责任地整合到公共卫生基础设施中的必要性。

在全球化时代，一场由鸟类引发的健康危机，其涟漪效应可能波及人类的餐桌、国际贸易乃至下一次大流行的预警系统。禽流感，特别是高致病性禽流感（HPAI）如H5Nx和H7N9，便是这样一个挥之不去的全球健康安全威胁。自2003年重现以来，H5N1已导致超过900例有记录的人类感染，病死率（CFR）超过50%。与此同时，H7N9也已造成逾1500例实验室确诊的人类病例。这些疫情不仅夺去生命，更迫使全球在2003至2023年间扑杀了超过5亿只家禽，造成巨大的经济损失，尤其冲击了以家禽为重要生计和蛋白质来源的低收入和中等收入国家（LMICs）。然而，传统的监测体系在数据收集、跨部门沟通以及应对实时错误信息方面仍面临挑战。正是在此背景下，以大型语言模型（LLMs）为代表的生成式人工智能（AI）的崛起，为增强风险沟通、支持情境化决策带来了变革性机遇。但将这些尖端工具应用于禽流感这样的人畜共患病领域，亟需一个严谨的评估框架，不仅要检验其事实准确性，还要考量其情境适应性、伦理合理性与对不同社会角色的沟通适宜性。为此，一项发表于《One Health》的研究应运而生，旨在系统评估当前先进LLMs在这方面的能力与局限。

研究人员采用了多模态、利益相关者分层的研究设计。主要方法包括：1. 结构化问题集评估：从世界卫生组织（WHO）、美国疾控中心（CDC）等权威机构资料中提炼出34个涵盖病毒学、流行病学、兽医与全球公共卫生等领域的问题，对四个模型进行查询并评估其回答的科学准确性。2. 合成情景（Vignette）分析：构建了16个模拟不同社会角色（如养殖户、医生、官员、记者等）在禽流感疫情下面临困境的小故事，用以评估模型的逻辑连贯性、情境保真度、实践效用及对公共信任、错误信息动态的敏感性。所有查询均通过仅推理API或隐私合规的网页界面进行，确保模型不会从评估中学习或存储数据。

结果部分展示了详细的研究发现。在事实准确性方面，谷歌的Gemini 1.5 Pro表现最佳，在34个问题中给出了31个完全正确的回答（准确率91.2%），其次是Grok（85.3%），ChatGPT-4o和DeepSeek R1均为82.4%。部分正确的回答主要集中在未充分强调某些理论风险（如食用未煮熟禽肉）缺乏确诊病例支持、或遗漏了重要细节（如针对H5N1和H7N9的预大流行疫苗已存在并储备）。在情景响应分析中，各模型展现了迥异的风格：ChatGPT-4o的回应强调法律规范清晰度和系统性责任，聚焦及时报告与协调，但缺乏程序细节和情感敏感性；Grok则采取程序化、任务导向的立场，提供清晰的操作步骤清单，适合实施但可能缺乏深度伦理思考；Gemini 1.5 Pro融合了共情推理与解释性清晰度，注重沟通与心理现实，更具人情味和可及性；而DeepSeek R1则提供了抽象的政策层面分析，强调结构性张力与制度改革，适合决策者但缺乏即时性和战术指导。研究通过“养殖户约翰”的情景具体说明了这些差异：ChatGPT-4o强调法律与伦理责任，Grok建议具体操作步骤，Gemini 1.5 Pro理解恐惧并解释早报告的好处，DeepSeek R1则聚焦于遏制策略和政策权衡。

讨论与结论部分指出，这项研究强调了LLMs作为增强生物监测、风险沟通和知情决策工具的不断发展的潜力。研究发现，虽然所有模型都展现出较高的科学回答基准能力，但它们在沟通风格、认知框架和适应性推理能力上存在显著异质性。没有单一模型能提供普遍最优解，每个LLM都体现了独特的沟通本体论——关于什么是相关知识、适当语气和可行指导的隐含世界观。这种认知多样性并非缺陷，而是一个关键特征，凸显了根据具体公共卫生目标、社会文化背景和目标受众进行审慎模型选择、微调和提示工程的需要。更重要的是，结果呼吁开发集成框架，通过集成方法、模型编排或基于智能体的系统，利用多个LLMs的互补优势。未来的研究方向应包括扩展评估框架的语言和文化范围，进行实时互动评估，整合可解释性工具，并纳入对抗性测试策略以评估模型对错误信息的韧性。总之，本研究为重新构想生成式AI在全球健康治理中的作用提供了基础性一步，倡导从静态、单一的部署转向灵活、情境感知且符合伦理响应的系统。在生态脆弱性加剧、人畜共患溢出事件频发和认知碎片化的时代，确保技术创新能够促进公平、适应性强且符合伦理的大流行防范至关重要。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部