在当今循证医学的框架下,随机对照临床试验(Randomized Controlled Trials, RCTs)是评估医疗干预措施有效性的“金标准”,为临床指南的制定提供了核心依据。然而,一个长期存在的核心困境在于:在严格控制的理想条件下得出的RCT结论,是否能够安全、有效地推广到现实世界中千差万别的患者身上?这种关于研究结果“外部有效性”(external validity)或“普适性”(generalizability)的疑问,始终是连接临床试验证据与真实世界临床实践之间的一道关键鸿沟。例如,在心血管领域,针对强化降压能否带来心血管获益,两项标志性试验——收缩压干预试验(Systolic Blood Pressure Intervention Trial, SPRINT)和糖尿病心血管风险控制行动(Action to Control Cardiovascular Risk in Diabetes, ACCORD)血压试验——却得出了看似矛盾的结果。这种差异可能源于试验纳入人群基线特征的不同,凸显了评估特定治疗在不同人群间效果平移的必要性与复杂性。
为了更科学地探究RCT结果在不同人群间的“旅行”能力,一项发表于《npj Digital Medicine》的研究提出了一种创新的“数字孪生”策略。该研究旨在解决如何量化评估一项RCT的结论适用于另一个特定人群(如另一项RCT的队列或真实世界人群)时的预期效果。研究人员构想,如果能为一项现有的RCT创建一个“数字孪生”——一个在统计学上与其原始试验等效,但患者特征分布却与目标人群相匹配的虚拟队列,那么通过比较原始RCT结果与“数字孪生”在该目标人群条件下模拟出的结果,就能直观评估治疗效应在不同人群间的稳定性和可移植性。基于此,研究团队开发了名为“RCT-Twin-GAN”的模型,其核心目标即是生成这种条件化的数字孪生,从而模拟RCT衍生治疗效应在不同患者群体间的转化。
为了开展这项研究,作者主要应用了几个关键技术方法。首先是开发了RCT-Twin-GAN这一核心模型,它是一个统计信息驱动的生成对抗网络(Generative Adversarial Network, GAN),其特点是能够学习并利用原始RCT中协变量(患者特征)与临床结局之间的复杂关系。其次,研究人员运用了来自两项著名心血管RCT(SPRINT和ACCORD试验)的公开患者数据作为验证队列,以重现已知的治疗效应差异。再者,为了将方法拓展至更广泛的应用场景,研究还整合了来自一个大型学术医疗中心的电子健康记录(Electronic Health Record, EHR)数据,构建了一个真实世界的高血压患者队列,用于模拟外部验证。
研究结果部分通过一系列分析验证了该方法的可行性与价值:
1. RCT-Twin-GAN generates digital twins that reproduce the covariate-specific relationships learned from the RCT. (RCT-Twin-GAN能够生成重现从RCT中学到的协变量特定关系的数字孪生。)
研究者首先证实,RCT-Twin-GAN生成的数字孪生能够成功捕捉并复现原始RCT数据中协变量与结局之间的内在关联。更重要的是,在数字孪生的干预组和对照组之间,所有协变量的分布都达到了出色的平衡,其均值绝对标准化均值差(mean absolute standardized mean difference, MASMD)低至0.019(标准差0.018),这确保了任何观测到的结局差异可更可靠地归因于治疗效应而非混杂因素。
2. RCT-Twin-GAN conditions the RCT on the covariate distribution of a target population. (RCT-Twin-GAN能够根据目标人群的协变量分布对RCT进行条件化生成。)