个体参与者数据Meta分析中研究者联系与数据获取框架的系统构建与应用评估

时间:2026年1月6日
来源:JBI Evidence Implementation

编辑推荐:

本综述系统提出了一套用于个体参与者数据Meta分析(IPD-MA)中联系研究者并获取数据的标准化框架,旨在解决IPD-MA项目实施过程中数据获取率低、沟通不透明等关键问题。文章详细阐述了从初步联系通讯作者到通过机构、同事、期刊等多渠道尝试的递进式策略,并定义了"无响应"研究的判定标准。通过一项比较米索前列醇与催产素预防产后出血的IPD-MA案例研究(纳入79项RCT),验证了该框架的实用性——成功促使10项研究的作者共享数据(其中6项用于最终分析),同时透明记录了31项"无响应"研究。该框架为提升IPD-MA的透明度和数据完整性提供了重要方法学支持,尤其有助于识别可能存在数据完整性问题的临床试验。

广告
   X   

引言
个体参与者数据Meta分析(IPD-MA)被视为评估临床干预措施的黄金标准。与传统的聚合数据Meta分析相比,IPD-MA能够进行更高级的统计分析,并在分析前检验数据的真实性。然而,联系研究者并获取个体参与者数据是IPD-MA项目中最耗时的环节。数据获取失败可能导致Meta分析结果出现偏倚。目前,缺乏系统性的指南来指导研究者如何联系研究者以及在何时停止沟通尝试。本文旨在提出一个框架,以提供一致且透明的作者联系方法,并清晰记录所有联系尝试,识别那些对合理沟通尝试无响应的研究者。
方法学途径
寻找作者联系信息
寻找作者当前的联系方式可能存在困难。建议首先尝试出版物或试验注册信息中指定的通讯作者邮箱或电话。其次,可检索试验注册库、ORCID数据库、其他出版物、学术社交平台(如ResearchGate、LinkedIn)以及搜索引擎来寻找其他邮箱或联系方式。若上述方法无效,可联系研究者所属机构(医院、大学)的部门负责人、教授或行政人员,以及资助方(如制药公司)。
联系作者与数据请求
研究者确定纳入的RCT后,即可开始发送IPD-MA参与邀请。联系顺序遵循一个递进式流程图:首先发送邀请给出版物上列出的通讯作者(方法1a)。若2周内无回复或邮件退回,则同时发送给通讯作者和第一作者(方法1b)。再等待2周无果,则联系通讯作者、第一作者和最后一位作者(方法1c)。若仍无回复,则向所有列出的作者发送邮件(方法1d)。
若经过方法1a至1d均无回复,研究者应进入方法2a:联系机构 affiliations。通常,作者会与大学或医院有关联。应联系相关部门负责人、资深教职人员或行政机构,同时也可尝试联系资助机构。研究者可自行决定重新联系机构和资助方的次数。若2周后仍无任何机构联系人回复,则进入方法2b。
方法2b要求定位RCT作者组的同事。同事可通过机构网站或共同发表的出版物来识别。此外,研究者可能正与来自相同地区或国家的其他研究的作者联系,此时可询问他们是否认识目标研究的作者。
在方法3中,研究者可请求同事通过其个人网络联系相关的国际联系人。例如,研究者可能有同事在国际机构任职,且与目标研究者所在国家或地区有联系。建议每2-4周提醒一次这些联系人;若仍无回复,研究者可进入方法4。如果可能,将RCT按国家整理的列表中添加该研究,以便后续联系特定国家的学者并询问是否认识列表中的研究者。
将RCT标记为"无响应"
如果经过长时间、重复尝试联系研究者及其相关机构同事后仍无回复,研究者可进入方法4。作为最后一步,可联系发表期刊并请求作者的联系方式。这可能获得新的联系信息,从而再次尝试通过邮件联系作者。如果期刊不回复或未提供新的联系信息,则该RCT被归类为"无响应"。
对IPD-MA邀请的回应应被清晰记录。研究者可能同意参与IPD,但随后停止回复索取IPD的邮件。如果研究者在此之后继续不回复邮件,研究者可将该试验标记为"无响应"。或者,如果研究者回应称无法共享IPD,研究者应记录此事,并可调查其回应的原因。例如,如果试验数据因丢失或销毁而无法获取,研究者可询问发生的原因和方式,尤其是对于近期进行的试验(研究者需自行判断"近期"的定义;例如,如果一项试验在过去5年内招募参与者而数据已无法获取,这值得关注)。
案例研究发现
在一项比较催产素与米索前列醇预防产后出血的IPD-MA中,检索共识别出79项RCT,并在24个月内(2021年4月至2023年4月)联系了研究者。79项试验中有48项(60.8%)的研究者对IPD-MA邀请作出了回应,其余31项(39.2%)未回应。在回应的研究者中,10项(20.8%)共享了IPD,38项(79.2%)未共享。10份IPD中有6份可用于IPD-MA,但4份因可信度问题被排除。
在48项有回应的试验中,41项指定了通讯作者,7项未指定。通讯作者对IPD-MA邀请作出回应的有23项(56.1%)。在这23个回应中,仅7名(30.4%)通讯作者是通过出版物上列出的详细信息联系到的。其余16名(69.6%)通讯作者是通过其他途径联系的,包括其他邮箱地址、发送至手机号码的WhatsApp邀请或通过ResearchGate联系。在41项(43.9%)实例中,IPD-MA邀请的回应来自出版物上列出的非通讯作者。
研究者的回应率随发表年份而变化。对于2005年或更早发表的RCT,回应率为88.9%(16/18)。2006年至2010年期间发表的RCT回应率相似(91.7%;11/12)。对于较近的研究,回应率下降。2011年至2015年期间发表的RCT,回应率为52.2%(12/23)。2016年至2020年期间发表的RCT,回应率为33.3%(5/15)。2020年之后发表的RCT,回应率相似,为36.4%(4/11)。
讨论
优势与局限性
提出的流程图指导研究者完成联系研究者和索取数据这一复杂过程。该框架是在澳大利亚墨尔本莫纳什大学妇产科系内,通过与资深和初级临床医生、研究人员讨论,并与在其他澳大利亚和国际大学工作的同事合作制定的。许多合作者正在进行IPD-MA项目,并在定位研究者联系方式和随后获取IPD方面遇到困难。该框架已应用于我们研究部门的多个IPD-MA项目。该流程图概述了研究者为寻找研究者联系方式可能采取的不同途径,并定义了此过程的合理界限。此流程图的可接受界限是通过与具有多年联系研究者获取数据经验的学术研究人员讨论确定的。
应用此框架有许多注意事项。首先,该框架是一个指南,并非一刀切的方法。研究者在考虑邮件发送次数和间隔时间时需要自行判断。同样,试验背景也很重要。如果研究者对一项历史悠久的试验没有收到回应,可以省略框架中的后续步骤,例如,选择不联系所属机构或发表期刊。
其次,该框架倾向于将电子邮件作为主要沟通方式。如果国家或文化的沟通方式不同,则该框架较难应用。例如,我们发现许多南亚研究者不太可能通过电子邮件回复,而更可能通过电话回复。这可能使框架中的后续步骤相关性降低,因为机构和期刊可能不愿传播研究者的电话号码。此外,我们尝试用英语联系作者。如果作者不说英语,他们可能不会回应邀请。
重要的是,该框架旨在引起研究者的回应;它并不评估作者的回应。如果该框架在收集和分析IPD的实践中实施,可能会增加回应的作者数量,但可能不会增加获取IPD的作者数量。作者可能会用可预测的借口回应不共享IPD,数据共享率低的老问题仍然存在。
评论
我们提出的用于联系研究者和请求IPD的框架有两个目的:i) 为联系研究者提供一致且透明的方法;ii) 提供一个逐步的方法来清晰识别和记录那些对合理沟通尝试无响应的研究者。
在我们的IPD-MA经验中,此框架是必要的,因为许多通讯作者通常无法通过试验出版物上列出的联系方式联系到,而试验数据需要从试验团队的其他成员处寻求。没有明确定义的框架,很难决定何时坚持、何时停止沟通尝试。该框架提供了一个统一的方法。有几次,研究者的回应似乎不太可能;然而,一旦找到一个正在使用的电子邮件地址或有效的电话号码,就成功获取了IPD。最大化从相关试验中检索IPD对于IPD-MA的严谨性至关重要,并可避免结果出现偏倚。
Veroniki等人曾提出一个指导研究者获取IPD的预先存在的流程图。该流程图强调了与研究者沟通的常见困难,并建议在4个月内联系作者5次。Veroniki等人建议首先电子邮件联系通讯作者,如果邮件无效,则联系其他列出的作者。如果没有回应,研究者应继续致电通讯作者,最后联系行业赞助商。虽然该框架提供了一个很好的概述,但缺乏必要的细节,假设通讯作者和公布的电子邮件地址是联系研究者的最佳方式。理论上这应该是对的;然而,根据我们的经验,很少收到通讯作者通过公布的电子邮件地址发出的邀请回复。通常,一个电子邮件地址看似有效,但很可能收件箱无人监控;因此,需要进一步指导其他沟通途径。此外,Veroniki等人的流程图没有充分描述如果作者或行业赞助商无响应时的后续步骤。我们的流程图建立在他们的方法之上,提供了关于沟通途径的进一步实用建议,以及合理沟通尝试的明确终点。
在我们的案例研究中,尽管经过多年的沟通尝试,超过三分之一的研究者无法联系到。这是一个重要的发现,因为近期发表作品的研究者应该可以就已发表的试验结果进行联系。逻辑上的解释为无回应提供了明显的借口,例如研究者更换机构或离开学术界。然而,发表时间超过20年的RCT的研究者通常比2020年以后发表的RCT的研究者更容易联系到,这是一个令人担忧的发现。这部分可能由这两组试验的地理分布差异解释。在2002年之前发表的18项RCT中,最具代表性的国家/组织是英国、世界卫生组织、土耳其和加拿大(10/18, 55.6%)。在2021年之后发表的11项RCT中,100%来自印度、巴基斯坦、埃及或伊朗。
这些RCT的地理分布差异可能与沟通差异有关;也许后者的国家不常规使用电子邮件。尽管如此,近期发表的试验(例如,过去5到10年内发表)缺乏回应仍然是一个令人担忧的发现。数据的可用性与数据的可信度之间存在已确立的联系;我们不能排除研究者无响应是因为他们不愿意或无法共享其数据。这些试验应接受数据完整性问题的筛查,目前有许多新开发的工具可用于此目的。
由于IPD-MA近年来的普及,有大量关于IPD-MA实施的文献。这些指南通常阐明了联系和与研究沟通的繁琐性,但未能详细排查此过程。此外,IPD-MA出版物中对这一过程的报告 notoriously 很差;一项2015年的IPD方法学综述发现,大多数IPD-MA项目没有报告数据是如何获取的、数据为何不可用,或者向多少项试验和参与者寻求了数据。这一过程应该是透明的,特别是考虑到大多数IPD-MA项目只包含了假定可用数据的一小部分,使研究暴露于数据可用性偏倚的风险之下,这可能影响结果的解释。
联系研究者的困难并非新现象。同样,获取IPD历来也是一个棘手的过程。为了应对低数据共享率,许多期刊开始强制要求数据共享声明,声明数据"可根据要求提供"。2023年,Hussey检验了这一政策的成效,得出结论:首先,"通常无法与通讯作者取得联系";其次,研究者会故意包含虚假声明,声称数据可根据要求提供,而实际上并非如此。
数据共享率一直很低。1962年的一项研究发现,24%的数据可根据要求提供;2006年的另一项研究估计该数字为24.5%;2023年的一项系统综述估计数据共享的范围在0%至37%之间。这些低比率以前被解释为后勤因素和阻止数据共享的机构协议。然而,鉴于越来越多的证据表明医学领域存在大量不可信的数据,研究者的无响应和缺乏数据共享值得更仔细的审视。毕竟,存在不共享IPD的 plausible 动机。原始试验结果很少可重现,而使用IPD更容易检测数据伪造。质疑某些研究者是否因数据伪造或站不住脚的结果而拒绝共享数据是非常重要的。
结论
提出的框架并非联系作者和获取IPD的万能药。许多研究者将仍然无法联系,许多数据集将不会被共享。然而,该框架指导研究者合理地穷尽联系研究者的途径。这可能会增加IPD的获取率,或获得关于数据为何不可用的明确回应。或者,它将透明地识别出哪些研究者在合理的沟通尝试后仍无法联系。这可能会促使研究者应用进一步措施来评估RCT的数据完整性问题。

生物通微信公众号
微信
新浪微博


生物通 版权所有