编辑推荐:
随着患者日益依赖人工智能(AI)获取健康信息,研究人员开展了一项关于ChatGPT-4和Google Gemini在糖尿病肾病(DN)患者咨询中表现的研究。结果显示AI工具虽能提供基本准确的信息,但与临床专家意见一致性较低,尤其在专科问题上表现欠佳,凸显AI目前仅能作为辅助工具而非替代临床决策。该研究为AI在肾病领域的应用提供了重要参考。
当患者越来越依赖人工智能(AI)获取医疗信息时,临床医生面临核心拷问:这些工具能否提供既准确又符合临床实践的回答?《JMIR Diabetes》最新研究给出了否定答案。研究者通过让ChatGPT-4和Google Gemini回答糖尿病肾病(DN)患者常见问题,并与两位资深肾科专家答案对比发现:虽然AI回答基本准确(无"完全不准确"评价),但与专家共识度显著偏低(κ=0.52 vs 专家间κ=0.61)。更令人担忧的是,ChatGPT-4两次相同提问的答案自洽性竟呈负相关(κ=-0.08)。
研究揭示AI存在"专科知识衰减"现象——问题越专业,准确率下降越明显。这在DN诊疗中尤为关键,因为透析时机选择等决策需要复杂临床判断。值得注意的是,AI在基础医学知识测试中表现优异,但在肾病专科评估和疾病编码(ICD)等专业任务中频频失误。
展望未来,AI应该定位于"临床助手"而非"替代者"。理想模式是AI负责信息整合和效率提升,医生专注诊疗决策和人文关怀。现阶段建议患者将AI输出视为参考资料,而非医疗建议。随着技术发展,如何将AI安全有效地整合到临床工作流,将成为下阶段研究重点。
生物通 版权所有