III期妇科肿瘤优效性试验中试验结果与期刊影响因子之间的关联

时间:2026年5月3日
来源:International Journal of Gynecological Cancer

编辑推荐:

加布里埃尔·莱文|艾米丽·埃利|露西·吉尔伯特|布拉德利·J·蒙克|罗伯特·L·科尔曼|布莱恩·M·斯洛莫维茨|雷坦·里贝罗|拉南·迈耶|德里克·斯科尔尼克|佩德罗·T·拉米雷斯 麦吉尔大学健康中心妇科肿瘤科,麦吉尔大学,蒙特利尔,魁北克,加拿大 **摘要** 背景

广告
   X   

加布里埃尔·莱文|艾米丽·埃利|露西·吉尔伯特|布拉德利·J·蒙克|罗伯特·L·科尔曼|布莱恩·M·斯洛莫维茨|雷坦·里贝罗|拉南·迈耶|德里克·斯科尔尼克|佩德罗·T·拉米雷斯
麦吉尔大学健康中心妇科肿瘤科,麦吉尔大学,蒙特利尔,魁北克,加拿大

**摘要**
背景
影响因子偏见(即阳性结果更倾向于发表在影响力较高的期刊上)可能会影响证据的可见性和解释。这种影响因子偏见是否存在于妇科肿瘤学试验中仍不清楚。我们评估了III期妇科肿瘤学随机对照试验中试验结果与期刊影响因子之间的关联。

**方法**
我们通过对ClinicalTrials.gov截至2024年5月发布的III期妇科肿瘤学随机对照试验进行了荟萃流行病学分析。仅纳入已完成的双臂、优效性设计的试验(因为这种设计可以清晰明确地解释试验结果),并且这些试验的主要终点数据已经发表。从每篇出版物中提取的数据包括发表年份的影响因子、入组患者数量、随访持续时间、疾病部位、作者数量、根据主要机构隶属关系确定的第一作者和最后作者的国家,以及主要结果(如果干预组在统计学上显著优于对照组,则结果被视为阳性)。主要结果按试验结果进行了期刊影响因子的分层。进行了单变量和探索性多变量分析,以确定与较高期刊影响因子相关的因素。

**结果**
共识别出36项符合条件的试验,发表时间为2009-2024年;其中47.2%的试验报告了阳性主要结果。所有试验的平均期刊影响因子为中位数35.1(四分位数范围[IQR] 18.3–51.6)(范围3.7-158.5)。阳性结果的试验发表在影响因子显著更高的期刊上(44.5 [IQR 18.7–71.5] vs. 24.0 [IQR 5.3–44.5],p=.034)。阳性结果的试验作者数量也更多(中位数21 vs. 16,p=.032)。在多变量线性回归分析中,阳性主要结果是唯一与较高期刊影响因子独立相关的因素。阳性结果发表在影响因子平均高32.6分(95% CI 6.4-58.8)的期刊上。随访持续时间和样本量不是显著预测因素。

**结论**
阳性结果的III期妇科肿瘤学试验发表在影响因子较高的期刊上,结果阳性与影响因子之间存在独立关联。这种模式可能会影响证据的可见性,并突显了支持高质量阴性研究传播的必要性。

**关于该主题的已有认识**
报告统计学上显著或有利结果的研究比那些报告阴性或中性结果的研究更有可能被发表和引用。影响因子偏见(即阳性试验更倾向于出现在影响因子较高的期刊上)已在某些临床领域得到描述,但在妇科肿瘤学领域仍研究不足。

**本研究的新发现**
在III期妇科肿瘤学随机对照试验中,报告阳性主要结果的研究发表在影响因子显著更高的期刊上。结果阳性与较高的期刊影响因子存在独立关联。试验规模、作者国籍和随访持续时间与发表在影响因子较高的期刊上无关,这表明证据的可见性可能更多地受到试验结果的影响,而非方法学因素的影响。

**本研究可能对研究、实践或政策的影响**
这些发现突显了妇科肿瘤学中证据可见性的差异性,可能会影响证据的综合和临床决策。编辑和出版商可以考虑采取措施促进高质量阴性研究的公平传播。研究者、审稿人和读者在解读妇科肿瘤学文献和进行系统评价或荟萃分析时应意识到影响因子偏见的存在。

**引言**
众所周知,报告干预措施阳性结果的研究比那些报告非显著结果的研究更有可能被发表(“发表偏见”1, 2)。然而,在临床随机试验迅速扩展以及医学技术和研究进步的时代,发表偏见已成为一个日益严重的问题。承认这种偏见的可能性并检查其发生情况对于确保科学文献的公正性和全面性至关重要3, 4。
在各种形式的偏见中,期刊影响因子的影响最近在多个医学领域引起了广泛关注[5]。影响因子偏见是指报告阳性干预结果的研究更倾向于发表在影响因子较高的期刊上,这可能会影响证据的可见性,导致对有利结果的过度关注[5]。随着专业期刊之间的竞争加剧,编辑对研究的偏好可能会提高引用率,未来的影响因子可能会进一步强化这种偏见6, 7。在肿瘤学领域,这种情况尤其令人担忧,因为系统评价和荟萃分析汇集了来自多个研究的数据来生成更高层次的证据,而在肿瘤学系统评价中通常不使用发表偏见评估8, 9。如果阳性结果的试验更倾向于发表在影响因子较高的期刊上,它们更有可能获得更高的可见性和引用率。因此,这些研究可能更容易被识别并纳入证据综合,特别是在依赖索引数据库和引用跟踪的文献搜索中。此外,阳性试验的突出地位可能会影响其在研究选择或权重分配中的方法学重要性。这些机制共同可能导致有利结果在汇总分析中的过度代表,从而可能高估治疗效果并产生有偏的临床解释。这种效应可能会因引用偏见而进一步放大,即报告统计学上显著或阳性结果的研究比那些报告零结果的研究被更频繁地引用,从而在后续的证据综合中增加其影响力[10], [11]。
尽管影响因子偏见已在医学的多个领域得到研究5, 12, 13,但在妇科肿瘤学领域仍研究不足。迄今为止,妇科肿瘤学特别依赖于有限数量的III期随机试验来指导临床实践,这增加了阳性与阴性研究可见性差异的潜在影响。鉴于该领域随机对照试验的数量庞大且不断增长,以及近期在肿瘤学领域对文献计量学的兴趣激增14, 15, 16,评估这种偏见的存在是及时且重要的。我们的目的是确定报告阳性干预结果的妇科肿瘤学随机对照试验是否更有可能发表在影响因子较高的期刊上。

**样本创建**
进行了荟萃流行病学分析。通过ClinicalTrials.gov注册库系统地搜索,以获得一个具有代表性的III期肿瘤学随机对照试验队列。搜索于2024年5月进行,没有时间限制,使用以下筛选条件:癌症(疾病类型)、III期(试验阶段)和有结果(试验结果)。选择ClinicalTrials.gov是因为它是最大的公开可访问的临床试验注册库,并且许多期刊和监管机构要求进行前瞻性试验注册,因此可以提供当代III期试验的全面来源,尽管它可能无法涵盖在美国以外进行的所有研究或那些在广泛注册要求之前启动的研究。符合条件的研究包括具有已发表主要终点的双臂、优效性设计的干预性肿瘤学随机对照试验,以确保排除正在进行中的试验或随访数据不成熟的试验。选择优效性设计是因为它可以清晰明确地解释试验结果。我们没有包括具有超过两个臂的试验,因为在评估多个成对对比时,对试验“阳性”的分类本质上是不明确的。直接证明优效性可以确立临床益处,而非劣效性设计可能产生反映相似疗效而非真正改善的结果,使临床解释更加复杂。对于每项符合条件的试验,所有相关出版物至少由两名研究者独立审核(图S1)。

**数据收集**
对于每篇纳入的出版物,我们提取了发表年份、期刊和对应于发表年份的期刊影响因子的数据。研究特征包括疾病部位、参与者数量和报告的随访持续时间。作者变量包括作者总数、第一作者和最后作者的所属国家。出于分析目的,将第一作者和最后作者的国家分为两组:美国和非美国。在后一种情况下,只计算单独命名的作者。在共同第一作者或共同最后作者的情况下,考虑名单上的第一个或最后一个作者。作者所属国家被分为美国和非美国,以反映美国学术机构和行业赞助者在III期肿瘤学试验的设计、资助和实施中的核心作用,以及它们对高影响力生物医学出版物的不成比例的贡献。这种二元分类是预先选定的,而不是更细粒度的地理分层,以保持统计功效并限制多变量回归分析的模型复杂性,从而降低过拟合的风险。如果干预组在统计学上显著优于对照组,则主要结果被分类为阳性或阴性。为了保持样本量并避免终点选择偏见,根据每项试验预先指定的主要终点确定统计显著性,而不是将分析限制在单一结果(总生存期或无进展生存期)。期刊影响因子值通过手动搜索获得,作者国家根据出版物中列出的机构隶属关系确定。

**主要结果**
主要结果是按试验结果分层的期刊影响因子。次要结果包括使用多变量分析确定与较高期刊影响因子独立相关的出版特征,并确定在较高影响因子期刊上发表的预测因素。

**统计分析**
数据以中位数和四分位数范围(IQR)以及数字和百分比的形式呈现。连续变量使用Mann–Whitney U检验进行比较,而分类变量则根据需要使用卡方检验或Fisher精确检验进行分析。对分类比较应用Bonferroni校正以调整多重检验并确定类别间的显著性。使用Kolmogorov–Smirnov检验评估数据分布的正态性。首先进行单变量分析,然后进行多变量线性回归分析,以确定与在高影响因子期刊上发表相关的独立因素。使用方差膨胀因子统计量评估独立变量之间的共线性。p值<.05被视为统计学上显著。数据使用IBM SPSS 29版(IBM公司,阿蒙克,纽约)进行统计分析。图表使用GraphPad Prism 8.4.3版(GraphPad软件,圣地亚哥,加利福尼亚)生成。根据期刊的指南,我们将提供数据供编辑团队选定的团队进行独立分析,以便进一步数据分析或在其他中心重现本研究。

**伦理批准**
由于没有分析个体患者数据,且所有数据都是公开的,因此该研究被认为无需机构审查委员会的批准。

**结果**
通过ClinicalTrials.gov共识别出36项III期妇科肿瘤学试验,发表时间为2009-2024年,其中17项(47.2%)报告了阳性主要结果,19项(52.8%)报告了阴性结果(表1)(图S1,表S1,表S2)。所有出版物的平均期刊影响因子为中位数35.1(四分位数范围[IQR] 18.3–51.6)(范围3.7-158.5)。每项试验的平均入组患者数为505人(IQR 301–723),平均作者数为19人(IQR 14–26)。大多数研究调查了卵巢癌(n = 23,63.9%),其次是宫颈癌(n = 6,16.7%)、子宫内膜癌(n = 5,13.9%)和平滑肌肉瘤(n = 2,5.6%)。大多数第一作者来自美国(24,66.7%),其次是德国(3,8.3%)和法国(2,5.6%)。最后作者也主要来自美国(20,55.6%),其次是意大利(3,8.3%)、德国、西班牙和比利时(各2,5.6%),其他国家的人数较少。

表1. III期妇科肿瘤学试验的特征
| 特征 | (%) | 中位数 [四分位数范围] |
|-------------|---------|------------------|
| 总试验数 | 36 |
| 影响因子 | 35.1 [18.3-51.6] |
| 发表年份 | 2018 [2014-2021] |
| 作者数量 | 19 [14-26] |
| 随访时间(月) | 19 [12-38] |
| 试验结果 | 阳性 17 (47.2%) | 阴性 19 (52.8%) |
| 招募患者数量 | 505 [301-723] |
| 癌症类型 | 卵巢癌 23 (63.9%) | 宫颈癌 6 (16.7%) | 子宫内膜癌 5 (13.9%) | 平滑肌肉瘤 2 (5.6%) |
| 第一作者国家 | 美国 24 (66.7%) | 德国 3 (8.3%) | 法国 2 (5.6%) | 其他(澳大利亚、中国、丹麦、日本、墨西哥、英国、西班牙)7 (19.4%) |
| 最后作者国家 | 美国 20 (55.6%) | 意大利 3 (8.3%) | 德国 2 (5.6%) | 比利时 2 (5.6%) | 其他(加拿大、中国、法国、韩国、墨西哥、英国、瑞士)7 (19.4%) |
| 报告阳性结果的试验的平均影响因子 | 44.5 [IQR 18.7–71.5] | 报告阴性结果的试验的平均影响因子 | 24.0 [IQR 5.3–44.5] | |
| | | | | |

阳性结果的试验的平均影响因子为44.5(IQR 18.7–71.5),而阴性结果的试验为24.0(IQR 5.3–44.5)(p = .034)(图1)。表2展示了阳性与阴性试验的比较。阳性结果研究的作者数量更多(中位数21 [IQR 16–29]),而阴性结果研究的作者数量较少(中位数16 [IQR 11–23];p = .032)。关于癌症类型,积极结果的研究更频繁地关注卵巢癌(82.4% 对 47.4%,p=.034)。第一作者所在国家的分布存在显著差异,非美国的第一作者的研究更有可能获得积极结果;在美国主导的研究中,8/24(33.3%)是积极的,而在非美国主导的研究中,9/12(75.0%)是积极的,p=.033。下载:下载高分辨率图片(99KB)下载:下载全尺寸图片

图1. 根据试验结果的期刊影响因子分布

脚注:根据试验结果划分的期刊影响因子分布。这些小提琴图展示了报告积极结果与消极或非显著结果的随机对照试验的期刊影响因子分布。每个小提琴的宽度代表给定影响因子下的观察值密度,虚线表示中位数。与消极试验相比,积极结果的试验发表在影响因子更高的期刊上(p = .034)。

表2. 积极和消极试验的比较

特征 积极结果(n=17) 消极结果(n=19) p值
影响因子 44.5 [18.7-71.5] 24.0 [5.3-44.5] .034
发表年份 2017 [2014-2022] 2018 [2015-2021] .91
随访时间(月) 18 [10-24] 21 [14-37] .26
招募患者数量 515 298-702 496 303-736 .96
作者数量 21 16 11 23 .032
癌症类型 卵巢癌 14 (82.4%) ∗ 9 (47.4%) ∗
宫颈癌 2 (11.8%) 4 (21.1%) *
子宫内膜癌 1 (5.9%) 4 (21.1%) *
平滑肌肉瘤 0 (0%) 2 (10.5%) *

第一作者所在国家 美国 8 (47.1%) 16 (84.2%) *
其他国家 9 (52.9%) 3 (15.8%) *

最后作者所在国家 美国 7 (41.2%) 13 (68.4%) *
其他国家 10 (58.8%) 6 (31.6%) *

Bonferroni校正后的多重比较,p=.034。

在评估与发表影响因子相关因素的多变量线性回归模型中(图2,表3),积极的主要结果是唯一一个独立与更高期刊影响因子相关的因素。积极结果发表在平均影响因子高32.6(p=.016)的期刊上。随访持续时间(p=.76)、样本大小(p=.17)和美国第一作者身份(p=.10)不是显著的预测因素。

下载:下载高分辨率图片(103KB)下载:下载全尺寸图片

图2. 预测更高影响因子的线性回归

表3. 预测更高影响因子的线性回归

变量 B(未标准化系数) 95%置信区间 p值
随访持续时间 -.122 −0.94 至 0.69 0.98
参与者数量 .026 −0.01 至 0.06 0.17
美国第一作者 22.01 -4.7 至 48.7 0.10
积极的主要结果 32.6 16.4 至 58.8 10.01 6

讨论

主要结果总结

本研究表明,报告积极结果的III期妇科肿瘤学试验比那些结果消极的试验更有可能发表在影响因子更高的期刊上。即使在控制了混杂因素后,积极结果仍然与更高的影响因子独立相关。

在已发表文献的背景下

影响因子最初并不是为了衡量期刊质量而设计的。然而,发表在高影响因子医学期刊上的文章通常被认为具有更大的临床意义、方法学质量和相关性[17]。由于影响因子是通过将引用次数除以发表的可引用文章数量来计算的[18],因此使用它作为期刊质量指标时存在一些注意事项。例如,影响因子可能会受到编辑政策的影响,这些政策倾向于增加综述文章的比例,而综述文章通常比原创研究论文获得更多的引用[19]。尽管有这些限制,影响因子仍然对科学知识和临床证据的认知产生了重大影响。

积极试验可能在某些方面系统性地不同于消极试验,这些差异超出了观察到的效应大小。大型、多中心的III期研究通常通过合作组(如妇科肿瘤学组(GOG)或欧洲癌症研究与治疗组织(EORTC)进行,这些研究通常有足够的统计能力来检测到虽小但具有临床意义的差异,因此招募的参与者数量远多于单机构研究。然而,积极结果的试验并不一定在参与者数量上比消极试验更多[20]。行业赞助也与报告统计学上显著的主要结果的可能性显著相关,特别是在评估新型系统性疗法而非外科干预的试验中[21, 22]。事实上,外科试验较少获得大规模资助,因此通常样本量较小,在发表的积极结果中占比也较低,或者采用的非劣效性方法学评估也较少。

临床医生可能由于时间限制而仅阅读其专业领域内影响因子最高的期刊,从而可能错过其他地方发表的宝贵研究[23, 24]。此外,影响因子在学术评估过程中也起着重要作用,影响大学和研究机构内的晋升、任命和资助评审决策[25]。尽管在医学的各个领域都研究了期刊影响因子的偏见,但在妇科肿瘤学领域尚未对其进行研究[12, 26, 27, 28]。在肿瘤学领域也有类似的研究发现,报告统计学上显著或积极结果的试验更有可能发表在影响因子更高的期刊上,并获得更多的引用率[29, 30]。这种趋势可能反映了编辑对新颖或改变实践的结果的偏好,或者作者选择将积极结果提交给更有声望的期刊。

在我们的研究中,多变量回归分析确认,即使调整了试验规模、随访持续时间和第一作者所在国家,积极的主要结果仍然是更高发表影响因子的独立预测因素。参与者数量和随访持续时间都没有显著影响发表影响因子,这支持了结果积极性和合作作者模式可能在塑造发表轨迹方面掩盖某些试验设计参数的观点。

优点和缺点

本研究系统地评估了III期妇科肿瘤学随机试验,采用了透明、预定义的荟萃流行病学设计,是首次系统地研究该领域影响因子偏见的分析。使用明确定义的资格标准和多变量建模增强了研究结果的有效性和可重复性。虽然没有正式的时间限制,但要求试验在ClinicalTrials.gov上报告结果并且有一个可识别的已发表的主要终点,这本质上选择了更现代的研究。较早的试验,特别是那些在广泛试验注册要求之前进行的试验,在ClinicalTrials.gov上的收录不那么一致,因此在注册库中可能没有结构化的结果。因此,尽管采用了无限制的搜索策略,最终队列反映了较新的发表时期,这与之前使用ClinicalTrials.gov为基础的抽样框架的荟萃流行病学研究一致。然而,我们的研究也有一些局限性。首先,我们的观察性设计本身存在选择偏倚。其次,尽管我们观察到积极试验和消极试验之间的期刊影响因子存在统计学上的显著差异,但样本量较小,这需要谨慎对待。试验积极性与美国主导研究之间的关联可能不稳定,可能是由于样本量小所致。此外,我们只包括了随机对照试验,因此我们的结论可能不适用于妇科肿瘤学中的其他类型的研究。我们的搜索策略使用了Clinicaltrials.gov,因此没有在该数据库中注册的研究未被纳入分析,这也代表了一种选择偏倚。尽管ClinicalTrials.gov是最大和最广泛使用的临床试验注册平台,但它可能无法完全覆盖在强制注册政策之前进行的较旧试验,或者在美国以外进行但未在该平台上注册的试验。因此,我们的队列可能低估了某些地理区域或较早的试验。最后,应该注意的是,这项研究可能无法区分编辑偏见和提交策略或临床重要性的差异。

对实践和未来研究的启示

未来的研究应包括定性方法,探讨驱动这种偏见的机制,评估其对临床决策和引用模式的影响,并探索促进高质量消极试验公平传播的编辑策略。

结论

总之,我们的研究表明,统计显著性与有利于积极结果的手稿的期刊影响因子之间存在关联。医学文献的读者应意识到这种潜在的偏见,研究者应被鼓励将设计良好、方法学严谨的研究提交给高影响因子的期刊,无论其发现的方向或显著性如何。

作者贡献声明

Derek Skolnik:调查
Pedro T Ramirez:数据管理、概念化
GABRIEL LEVIN:正式分析、数据管理、概念化
Emily Eiley:数据管理
Lucy Gilbert:调查
Bradley J Monk:概念化
Robert L Coleman:数据管理、概念化
Brian M Slomovitz:概念化
Reitan Ribeiro:方法学、调查
Raanan Meyer:概念化

利益冲突

鉴于GL RR和PTR担任编辑委员会成员、视频编辑和主编的角色,他们没有参与本文的同行评审,也无法获取有关其同行评审的信息。

患者出版同意

不适用,因为没有使用患者数据,所有数据都是公开可用的。

资金

生物通微信公众号
微信
新浪微博


生物通 版权所有