集群随机试验中估计目标定义的特殊考量:ICH E9(R1)框架的扩展与完善

时间:2025年10月12日
来源:Journal of Clinical Epidemiology

编辑推荐:

本研究针对ICH E9(R1)估计目标框架在集群随机试验(CRT)中的适用性不足问题,系统梳理了相关文献,旨在明确CRT定义估计目标时需额外考虑的八个关键项目。研究结果为CRT的设计与分析提供了重要指导,确保了估计目标的明确性和临床相关性,对提升临床试验质量具有重要意义。

广告
   X   

在医学研究领域,随机对照试验被视为评估干预措施效果的“金标准”。然而,传统的试验设计通常以个体为单位进行随机分组,即每个参与者被独立地分配到不同的治疗组。但在某些情况下,以个体为单位进行随机化并不可行或不合适。例如,当评估一项公共卫生干预(如在学校推广健康饮食教育)或一项组织层面的改革(如在新诊所实施新的诊疗流程)时,干预措施天然地作用于一个群体而非单个个体。这时,研究人员往往会采用集群随机试验(Cluster Randomised Trial, CRT)的设计,即将整个群体(如学校、村庄、诊所)作为一个整体(即“集群”)进行随机分组,同一集群内的所有个体接受相同的干预。
尽管CRT设计解决了实践中的难题,但它也为试验结果的解读带来了新的挑战。其中一个核心挑战便是如何清晰、准确地定义“估计目标”(Estimand)。估计目标是临床试验中一个至关重要的概念,它精确地描述了研究者希望通过研究量化的治疗效应,包括了“对谁”、“在什么条件下”、“测量什么”以及“如何处理试验过程中发生的事件”等关键问题。为了规范估计目标的定义,国际人用药品注册技术协调会(International Council for Harmonisation, ICH)发布了E9(R1)统计原则增补文件,列出了定义估计目标时应阐明的五个属性。然而,这份重要的指南主要是基于个体随机试验的框架制定的,对于CRT中特有的复杂性,例如如何界定集群总体、如何权衡个体与集群的贡献等,并未给出详细的指导。这就导致研究者在设计CRT时,对于如何定义一个既科学严谨又符合临床实际的估计目标,可能感到无所适从。
正是为了填补这一空白,由Dongquan Bi、Andrew Copas、Fan Li和Brennan C. Kahan组成的研究团队开展了一项“综述中的研究”(Study within a Review)。他们的研究成果发表在《Journal of Clinical Epidemiology》上,旨在系统性地识别出在CRT中定义估计目标时,除了ICH E9(R1)列出的五个属性之外,还需要考虑哪些额外的项目。这项研究的意义在于,它为CRT的研究者提供了一个更全面、更具操作性的清单,有助于确保CRT所估计的治疗效应是明确无误的,并且对临床医生、患者和政策制定者等最终用户具有真正的参考价值。
为了达成研究目标,研究人员采用了系统性的文献检索方法。他们检索了多个学术数据库,并查阅了作者个人的文献库,以寻找那些讨论了CRT估计目标定义、且其讨论内容超出了ICH E9(R1)五个属性范围的学术文章。通过对筛选出的合格文献进行内容分析,研究者归纳整理出了一份CRT定义估计目标时可能需要额外考虑的项目清单。
通过对46篇符合要求的文献进行深入分析,研究者成功识别出八个在CRT中定义估计目标时需要特别考虑的关键项目。这些项目构成了对ICH E9(R1)框架的重要补充。
(一)集群总体(Population of clusters):在个体随机试验中,目标人群通常是患有某种疾病的个体患者。而在CRT中,首先需要明确的是“集群总体”,即试验旨在推断的集群集合(如所有符合条件的学校),然后才是每个集群内的“个体总体”。明确集群总体是定义估计目标的第一步,它决定了研究结果的推广范围。
(二)选择偏倚下的个体总体(Population of individuals under selection bias):CRT中,个体的招募有时会在集群被随机化之后进行,这可能导致选择偏倚,即进入试验的个体不能代表其所在集群的所有个体。估计目标需要明确,所关心的效应是针对实际上被招募的个体,还是针对理论上在随机化之前就已确定的整个个体总体。
(三)个体/集群接受治疗的暴露时间(Exposure time of individuals/clusters on treatment):在CRT中,干预措施的实施可能在集群层面或个体层面存在时间上的变异。例如,一个集群可能较晚才开始实施干预,或者集群内的个体可能在不同时间点加入。估计目标需要明确治疗效应的评估是基于何种假设下的暴露时间(如计划暴露时间、实际暴露时间)。
(四)个体和集群的加权方式(How individuals and clusters are weighted):这是CRT的一个核心特性。治疗效应的汇总可以有两种视角:一是“个体平均”(individual-average)效应,即每个个体在效应估计中占有同等权重,这反映的是对个体患者的平均影响;二是“集群平均”(cluster-average)效应,即每个集群在效应估计中占有同等权重,这反映的是对集群(如诊所)的平均影响。这两种方式得出的估计值和解释可能截然不同。
(五)汇总指标是边际性的还是集群特异性的(Whether summary measures are marginal or cluster-specific):统计模型的选择也会影响估计目标的含义。“边际模型”(Marginal model)侧重于估计总体平均效应,而“集群特异性模型”(Cluster-specific model)则试图估计在保持集群特征不变条件下的效应。前者更关注“宏观”政策效果,后者则有助于理解干预本身的内在效应。
(六)处理集群层面干预事件(Strategies used to handle cluster-level intercurrent events)的策略:干预事件(ICE)是指在治疗计划开始后发生的影响治疗状态或结局评估的事件。在CRT中,有些ICE会发生在整个集群层面,例如一个诊所决定完全停止实施被分配到的干预方案。估计目标需要明确如何对待这些集群层面的ICE(如将其视为治疗策略的一部分、或采用假想策略等)。
(七)如何处理干扰/溢出效应(How interference/spillover is handled):干扰或溢出效应是指一个个体的结局受到同一集群内其他个体所接受治疗的影响,或者不同集群间的个体相互影响。这在CRT中尤其值得关注。估计目标需要明确是否假设不存在干扰,或者如果存在干扰,研究旨在估计何种类型的效应(如直接效应、间接效应)。
(八)如何处理离开或变更集群的个体(How individuals who leave or change clusters are handled):在随访期间,个体可能离开其原始集群(如学生转学),或者整个集群的结构可能发生变化。估计目标需要明确对这些个体的处理策略,例如是依据其初始分配的集群进行分析,还是依据其实际所属的集群进行分析。
本研究通过对现有文献的系统梳理,明确指出了在集群随机试验(CRT)中定义估计目标(Estimand)时,需要超越ICH E9(R1)指南的五个基本属性,额外考虑八个关键项目。这八个项目涵盖了从目标总体界定、加权方式、统计模型选择到如何处理CRT特有的偏倚和事件(如选择偏倚、集群层面干预事件、干扰效应)等多个维度。
这项研究具有重要的理论价值和实践指导意义。在理论层面,它扩展和细化了ICH E9(R1)的估计目标框架,使其能够更好地适应CRT的复杂设计,推动了临床研究方法学的发展。在实践层面,它为CRT的研究者、申办方和监管机构提供了一份清晰、实用的清单。在研究设计阶段,参考这份清单有助于研究者更全面、更严谨地预先定义估计目标,从而避免试验结束后在结果解读上出现歧义或争议。这不仅能够提升CRT的科学质量,更能确保其得出的证据能够准确、有效地为医疗决策提供信息,最终使临床医生、患者和公共卫生政策制定者受益。总之,该研究为提升集群随机试验的规范性和结果的可解释性做出了重要贡献。

生物通微信公众号
微信
新浪微博


生物通 版权所有