机器学习模型已被用于根据社会决定因素(SDoH)预测心血管疾病的风险,但输入数据是模型的主要挑战。
6同样,基于SDoH数据的神经网络AI模型能够识别需要处方提醒的Medicare受益者,并识别可以从协助中受益以改善药物依从性的患者。
7尽管这些模型显示出潜力,但如果没有了解根本原因,它们仍然容易受到偏见的影响
8。此外,所使用的数据在年龄、种族和社会经济地位方面往往具有同质性,这可能会限制其在现实世界人群中的表现。
7
随着AI开始影响医疗决策,必须考虑到医疗数据中的输入或普遍存在的偏见可能在这些工具中得到体现。先前的研究表明,与白人患者相比,少数族裔在疼痛控制方面得到的支持较少。9这些差异的根本原因多种多样,涉及系统性偏见、文化沟通不畅以及限制医疗服务的社会经济障碍。同样,其他弱势群体(如有多重药物使用障碍的患者)也因污名或偏见而在疼痛控制方面面临挑战。10疼痛管理不当的后果非常严重,包括恢复时间延长、慢性疼痛风险增加和生活质量下降。如果要将LLMs用于医疗决策,就需要探讨这些模型输出中可能体现的人类偏见。
像AI这样的创新为减轻临床决策中的无意识偏见提供了有希望的途径,至少在理论上,可以消除疼痛管理中的人为主观性。目前,AI的贡献程度取决于其原始数据的质量,因此继续学习和改进现有工具非常重要。11通过大量数据,AI能够过滤图像、问题和内容。建模过程的一部分应继续包含人类反馈,这是维护基于民主系统的AI和cGPT的完整性和伦理性的关键部分。12,13如果以这种方式进行优化,AI在医疗保健中的应用有可能减轻决策负担,使临床决策者能够更专注于患者的需求,采取更加个性化的患者中心方法。最重要的是,使用文化和种族中立的模型可以使护理更加基于证据,并总体上更加公平。
本研究的目的是模拟并调查在将cGPT作为临床资源时,种族、社会经济状况和医疗历史差异对疼痛管理建议的影响。我们选择关注疼痛管理,因为疼痛是急诊科(ED)就诊的常见原因,并且文献中明确记载了不同患者群体在疼痛管理方面的差异。
研究设计与设置
研究设计与设置
我们评估了cGPT在(1)不同研究人员之间以及(2)九种人口统计变体下的六个临床场景中生成一致疼痛管理计划的能力。我们使用了由OpenAI开发的cGPT 4.0版本15,该版本能够更好地理解、推理并生成更可靠的交互。它的能力包括生成类似人类理解的文本响应,并已被用于临床决策的模拟2。
结果
cGPT共评估了60个场景(表1)。根据Kappa和Gwet的结果,所有研究人员之间存在一定的差异。具体来说,在场景F(深静脉血栓形成)的急诊用药建议上,三位研究人员之间的一致性较低;Gwet AC1:0.22 [-0.38, 0.81],Fleiss’ Kappa 0.11 [-0.53, 0.75](表2)。此外,在场景A(偏头痛)的出院用药建议上,三位研究人员之间也有一定程度的一致性
讨论
在过去的十年中,特别是在COVID-19危机之后,我们的医疗系统强调了实现健康公平的必要性。16,17为了解决这个问题,我们必须承认技术在加剧或减少这些差异方面起着关键作用17,18。关于cGPT、LLMs和AI的未来,最紧迫的问题是确定实施限制的适当情况以及何时允许更大的灵活性。
结论
总之,这项研究表明,临床决策领域的AI模型确实考虑了重要的因素,如住房不稳定、先前的阿片类药物使用障碍或种族。具体来说,cGPT利用启发式方法和风险因素来适当调整有阿片类药物使用障碍史患者的建议,最终反映了某种“最佳实践”形式的偏见。
随着AI和精准医学的发展以及数据的普及,有机会构建和
文章总结
为什么这个话题重要?
疼痛管理方面的差异,尤其是在种族、社会经济地位和药物使用史方面的差异,已有充分记录。随着像Chat GPT(cGPT)这样的AI工具在医疗保健中的整合,了解这些工具是否会加剧或减轻这些偏见至关重要。
这篇综述试图说明什么?
资金支持
部分研究资金来自Scott Weiner博士的继续医学教育账户,用于支持数据和统计分析工作。
披露
CF在PontRx和Centaur Labs持有股权。CF是Philips Ultrasound的付费顾问。EF接受了Centaur Labs的报酬,并且是EMD Serono的顾问。AM目前受雇于Google Cambridge,但手稿完成时尚未入职。AM是iDoc Telehealth Solutions的付费顾问。SW是Vertex Pharmaceuticals的科学顾问委员会成员。
参考文献
- 1.
Hirosawa T, Harada Y, Yokose M, Sakamoto T, Kawamura R, Shimizu T. 生成预训练Transformer 3聊天机器人生成的临床案例鉴别诊断列表的诊断准确性:一项初步研究。国际环境研究与公共卫生杂志. 2023;20(4):3378.
- 2.
Rao A, Pang M, Kim J, 等. 评估ChatGPT在整个临床工作流程中的效用。MedRxiv. 2023:2023.02.21.23285886.
- 3.
Gilson A, Safranek CW, Huang T, 等
作者贡献声明
Chanel Fischetti:撰写 – 审阅与编辑、撰写 – 原始草稿、监督、资源管理、项目管理、方法论、调查、数据分析、概念化。Emily H. Frisch:撰写 – 审阅与编辑、撰写 – 原始草稿、调查、数据分析。Giovanni Rodriguez:撰写 – 审阅与编辑、撰写 – 原始草稿、资源管理、项目管理、方法论、调查、数据分析、
利益冲突声明
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:CF在PontRx和Centaur Labs持有股权。CF是Philips Ultrasound的付费顾问。EF接受了Centaur Labs的报酬,并且是EMD Serono的顾问。AM目前受雇于Google Cambridge,但手稿完成时尚未入职。AM是iDoc Telehealth Solutions的付费顾问。SW是Vertex Pharmaceuticals的科学顾问委员会成员。