综述：一个用于分析现实世界医疗证据中偏见来源的多维度层次框架：一项范围综述

时间：2026年1月22日

来源：Journal of Biomedical Informatics

编辑推荐：

本研究针对电子健康记录（EHR）生成真实世界证据（RWE）中的偏见问题，构建了覆盖医疗提供、数据管理和研究三个阶段的七级多维框架，系统分类了209个偏见来源，揭示医疗阶段偏见占比最高（108例），数据管理和研究阶段分别占54例和47例，为解决大规模跨国研究中的偏见问题提供结构化基础。

约翰霍普金斯大学医学院生物医学信息学与数据科学系，美国马里兰州巴尔的摩市

摘要

目的

本研究识别并分类了从电子健康记录（EHR）生成真实世界证据（RWE）过程中的各种偏见来源，并构建了一个多维概念框架，以描述大规模跨国联合网络研究中偏见产生的机制。

方法

通过整合现有框架、进行结构化文献回顾以及多学科专家小组的迭代评估，我们开发了一个涵盖医疗保健提供、数据管理和研究三个阶段的三阶段偏见框架。遵循PRISMA-ScR指南，我们对2016年至2025年间PubMed和Web of Science上的研究进行了范围审查，重点关注使用真实世界数据的观察性研究中的偏见。根据偏见在RWE生成过程中的出现阶段，使用定向内容分析对偏见来源进行了分类。

结果

在该框架下分析的220篇论文中，确定了209种不同的偏见来源，这些偏见被归类为七个具体层面：医疗护理获取（n=40）、护理提供（n=29）、数据采集与测量（n=39）、临床文档记录与编码实践（n=32）、数据提取（n=22）、数据建模（n=11）和数据分析（n=36）。医疗保健阶段的偏见最为普遍（n=108），其次是数据管理阶段（n=54）和研究阶段（n=47）。

结论

这个多维框架揭示了RWE生成过程中偏见来源在患者、提供者、行政、信息技术、信息学和分析领域之间的相互关联性，并为理解大规模观察性研究中偏见可能产生的位置和方式提供了结构基础。

引言

数字真实世界数据（RWD）的可访问性不断提高，以及人工智能（AI）和机器学习（ML）技术的快速发展，极大地激发了利用RWD进行临床研究和生成真实世界证据（RWE）的兴趣[1]。电子健康记录（EHR）通过捕获来自不同医疗环境中的数百万临床数据点，成为RWD的重要来源[2]、[3]。EHR的广泛采用从根本上改变了RWE的生成方式，使研究人员能够以前所未有的规模和速度描述患者群体、估计治疗结果并预测预后[4]。鉴于这一潜力，美国食品药品监督管理局（FDA）逐渐将基于EHR的RWE纳入药物开发、上市后监测和治疗安全性评估的监管决策中，尤其是在《21世纪治愈法案》中明确强调了使用RWE之后[5]、[6]。随着全球医疗系统的数字化转型，基于EHR的RWE已成为支持临床指南制定、健康技术评估和持续学习健康系统的重要组成部分[7]。

尽管RWE研究的数量不断增加，但系统地研究数据转换生命周期中偏见是如何引入和传播的这一问题仍基本未被解决。现有的偏见主要通过分析阶段的统计调整来处理[8]、[9]、[10]。大规模观察性研究往往容易受到从临床护理到研究分析整个过程中存在的固有偏见和未测量混杂因素的影响[11]。先前的研究表明，数据相关偏见源于信息缺失、不完整、不一致或记录不当，以及特定人群在医疗系统中的代表性不足或过度代表，这些因素会影响研究结果并限制研究结果的可靠性[8]、[9]。进一步的研究表明，人为偏见源于医疗提供者的行为，包括不同的文档记录实践、隐含的社会刻板印象以及临床决策模式的变化，这些都会使医疗数据中的偏见解释变得更加复杂[11]。此外，医疗保健获取的差异也被证明会引入转诊和入院偏见，导致不同人群之间的疾病严重程度和结果存在系统性差异[11]，这表明RWD中的偏见具有复杂和多维的性质。

已经开发了一些专注于EHR生成生命周期中偏见的框架，但这些框架仍然缺乏一种统一的方法来全面记录偏见的起源及其对联合医疗研究有效性的影响[8]、[10]。TRANSFoRm数据流框架仅说明了在护理提供与重新使用EHR数据的应用程序之间的数据流过程中偏见是如何产生的，识别了数据链不同步骤中可能导致分析结果无效的13个可能的偏见来源[12]。同样，Ban等人仅关注于生成RWE的路径中发生的偏见分类，区分了提供护理和记录的医疗系统层面，以及提取、转换和加载（ETL）和数据解释过程中出现偏见的研发层面[13]。因此，现有框架尚未完全解决与联合学习等分析方法相关的偏见问题，而这些方法需要跨机构的数据协调和标准化来支持互操作性。此外，现有文献中系统地研究从临床环境中的初始数据捕获到数据整理、标准化和分析建模整个路径中偏见传播的多维视角仍然有限。

为了解决这些不足，我们构建了一个概念框架，详细描述了从床边临床遭遇到研究证据生成的全部数据生成生命周期，并通过范围审查构建了一个全面的偏见来源分类体系。利用分层分类方案（

\to

领域

\to

具体来源），我们识别并分类了框架每个层面的记录偏见来源，为研究人员提供了理解使用EHR数据的大规模观察性研究中偏见多方面性质的参考。

部分摘录

框架开发

在现有框架的基础上，这些框架概述了基于EHR的研究和AI模型开发/部署中的偏见，我们开发了一个多维框架，用于识别和分类联合医疗研究环境中整个RWE生成生命周期中的偏见来源。我们采用了Templin等人提出的经过验证的开发框架，具体方法包括：（1）结构化文献回顾，（2）对已建立的RWE生成路径的系统性整合

偏见来源识别

我们确定了209种可能影响EHR生成RWE的偏见来源（表1）。这些偏见来源被分类并映射到我们的七层多维分层框架中，揭示了偏见如何在RWE流程的不同阶段被引入。在第一层，我们确定了40种与人口统计学特征、生活方式因素、居住地、社会经济状况和临床特征相关的偏见来源（表1）。其中29种偏见来源

讨论

这项范围审查概述了使用EHR数据在RWE生成过程中偏见是如何产生和传播的，并提出了一个框架来解决大规模观察性研究中的这些偏见。源于医疗保健获取差异的偏见，由人口统计学、社会经济和临床因素驱动，是RWE研究中最为普遍和有影响力的偏见来源之一。为了更好地理解这些相互关联的问题，我们开发了一个七层

结论

本研究构建了一个涵盖医疗保健、数据管理和研究层面的多维框架，用于识别和分类临床证据生成中的偏见来源。这些偏见表现出跨越传统边界的相互关联性，并在多个层面累积，EHR派生的数据反映了医疗保健和数据管理系统而非实际的患者健康状况。该框架可作为方法学家的参考，帮助他们确保

伦理批准

不适用。

贡献

李海云：收集、审查和分析论文；开发偏见框架；撰写手稿。P.N.提出了研究思路，创建了框架草案并监督了研究。H.L.参与了框架开发和结果讨论。C.X.担任了文献回顾和数据分析的第二次审稿人。D.B.完善了框架和手稿内容。C.H.参与了框架和方法论的讨论。J.T.参与了讨论

CRediT作者贡献声明

李海云：写作——审稿与编辑、撰写——初稿、可视化、方法论、调查、概念化。熊Christelle：写作——审稿与编辑、调查、数据整理。Derek Baughman：写作——审稿与编辑、监督、方法论、数据整理。陈敦：写作——审稿与编辑、方法论、数据整理。童佳怡：写作——审稿与编辑、验证、方法论、数据整理。本杰明·马丁：写作——审稿与编辑、验证