基于组织病理学的AI驱动虚拟空间蛋白质组学在肺癌可解释生物标志物发现中的应用

时间:2026年1月6日
来源:Nature Medicine

编辑推荐:

本文介绍了一种名为HEX的AI模型,该模型能够直接从标准H&E(苏木精-伊红)染色组织病理学切片中计算生成高维空间蛋白质组学图谱。研究显示,通过整合原始H&E图像与AI衍生的虚拟空间蛋白质组学数据,能够显著提升非小细胞肺癌(NSCLC)患者的预后判断(提升22%)和免疫治疗反应预测(提升24-39%)的准确性。该技术为研究空间生物学提供了一种低成本、可扩展的新途径,并揭示了与治疗反应相关的肿瘤-免疫空间生态位(例如,应答者中辅助性T细胞与细胞毒性T细胞的共定位,以及无应答者中免疫抑制性肿瘤相关巨噬细胞和中性粒细胞的聚集),对推动精准医学发展具有重要意义。

广告
   X   

研究概述
空间生物学作为基础发现和精准医学的新前沿,其技术如空间蛋白质组学能够实现蛋白质表达的高分辨率图谱绘制,从而改变我们对生物学和疾病的理解。然而,其临床转化仍面临成本、复杂性和可扩展性等重大挑战。本研究提出了一种名为H&E to protein expression (HEX)的人工智能模型,旨在直接从标准组织病理学切片计算生成空间蛋白质组学图谱。
研究团队对来自10例非小细胞肺癌(NSCLC)患者的肿瘤样本的同一组织切片进行了CODEX(Co-detection by indexing)和高通量免疫荧光成像以及H&E染色。CODEX实验设计了一个包含40种蛋白质的检测 panel,涵盖了谱系、免疫、结构和功能标志物,能够全面表征肿瘤微环境(TME)的空间表型。两种实验获得的整张切片图像(WSI)经过配准后,被裁剪成约50微米大小的小图像块,最终获得了约75.5万个具有40种蛋白质生物标志物表达及其匹配的H&E组织病理学图像块的数据集,用于模型训练。
HEX模型利用了最先进的病理学基础模型(如MUSK),基于H&E图像同时预测40种蛋白质生物标志物的表达,从而能够从标准组织病理学中生成虚拟空间蛋白质组学图谱。模型的蛋白质表达准确性在两个独立数据集(共372个肿瘤样本)上进行了评估。为了评估HEX在NSCLC之外的泛化性,还在一个包含34种组织类型、206个肿瘤样本的泛癌数据集上进行了外部验证,该数据集包含57重CODEX和匹配的H&E图像。
HEX能够从H&E图像中准确预测蛋白质表达
研究通过交叉验证和独立验证评估了HEX的性能,并使用了四个互补的指标:皮尔逊相关系数(r)、斯皮尔曼相关系数(r)、结构相似性指数(SSIM)和均方误差(MSE)。HEX的表现与两种基于生成对抗网络(GAN)的组织学图像转换方法进行了比较。
在斯坦福-WSI数据集上进行五折交叉验证的结果显示,HEX能够从H&E图像中准确预测蛋白质表达,平均皮尔逊r为0.790,斯皮尔曼r为0.787,SSIM为0.949,MSE为0.076。HEX consistently outperformed both GAN methods, with substantial improvements of 46% in Pearson’s r, 44% in Spearman’s r, 15% in SSIM and an 80% reduction in MSE compared with the second-best model, conditional GAN (CGAN).
为了定性评估预测生物标志物的空间模式,研究可视化了真实的CODEX图像以及从H&E图像生成的虚拟CODEX图像。HEX模型能够生成高保真度的虚拟CODEX图像,准确反映了结构、免疫、谱系和功能标志物的空间组织和表达模式。值得注意的是,HEX能够以用户指定的任何空间分辨率生成虚拟CODEX图像。通过使用更小的窗口和步长(从224像素降至14像素)进行训练,HEX能够输出高分辨率的虚拟CODEX结果,并增强对细粒度空间模式的可视化。
在独立验证方面,研究将模型在完整的斯坦福-WSI数据集上训练后,在两个独立的组织微阵列(TMA)队列(斯坦福-TMA和TA-TMA,共372个肿瘤样本)上评估其性能。HEX在所有40种生物标志物上均表现出 consistently high Pearson’s r values。在第一个斯坦福-TMA数据集上,HEX在所有生物标志物上的平均皮尔逊r为0.738,斯皮尔曼r为0.741,SSIM为0.875,MSE为0.189。与第二好的模型(CGAN)相比,HEX nearly doubled the key performance metrics。在第二个TMA数据集上,HEX同样表现出强大的预测性能。这些结果共同凸显了HEX在独立数据集上的泛化性和稳健性,且HEX在各种评估指标上均显著优于现有方法。
研究还通过亚细胞定位(核、胞质、膜)对性能进行了分层,观察到各组间具有可比性的准确性。此外,在一个公开的泛癌数据集上的外部验证表明,尽管存在组织类型、染色方案和成像平台的差异,HEX在不进行微调的情况下,在24种重叠的生物标志物上仍取得了强大的预测性能(平均皮尔逊r:0.658),仅略低于在斯坦福数据集上的表现(平均皮尔逊r:0.718)。HEX还 substantially outperformed the second-best model (CGAN) across all evaluation metrics。这些结果证明了HEX在不同组织类型、染色方案和成像平台间的稳健性和泛化性。
为了评估HEX对新组织类型和扩展生物标志物panel的适应性,研究在来自伯尔尼数据集的140个结直肠癌(CRC)核心上进行了重新训练和微调实验,使用了全部57种蛋白质标志物——其中33种不在原始的NSCLC panel中。当从头开始重新训练时,HEX取得了良好的预测性能(平均皮尔逊r:0.566),表明其能够泛化到不同组织中的新蛋白质标志物。对经过NSCLC训练的HEX模型进行微调——通过重新初始化输出头并适应CRC数据——进一步提高了性能(平均皮尔逊r:0.659)。值得注意的是,在共享的和CRC特有的生物标志物上都观察到了改进。这些结果证实,HEX可以通过最小的架构更改和有限的训练数据,有效地适应新的组织和标志物panel,从而实现在不同组织学背景下虚拟空间蛋白质组学的可扩展部署。
研究还使用匹配的免疫组织化学(IHC)和H&E切片对HEX衍生的空间蛋白质组学进行了正交验证。在三个肺肿瘤上的评估显示,HEX预测的IHC测量结果具有良好的空间一致性——皮尔逊r分别为0.479(CD31)和0.606(Ki-67)——并且显著优于CGAN基线。
最后,研究评估了使用不同基础模型主干和训练策略的影响。基于MUSK主干初始化的HEX模型获得了最高的总体准确度,而基于CONCH主干的模型显示出更快的推理速度,但准确度较低。为了剖析训练策略的作用,研究进行了消融实验,从原始HEX模型中移除特征分布平滑(FDS)或自适应损失函数(ALF)。在两种情况下,模型在所有指标上的性能均显著下降,表明这些组件对于实现稳健和可泛化的预测是必要的。
HEX改善早期肺癌的预后预测
通过从标准H&E图像生成空间蛋白质组学的能力,HEX通过增加一层分子洞察力,实现了具有生物学可解释性的临床相关结局预测。虽然H&E提供了详细的组织形态学信息,但虚拟CODEX图谱提供了关于空间分辨的蛋白质表达的补充信息。为了整合这些不同但协同的数据类型,研究开发了多模态整合 via co-attention (MICA),这是一个深度学习框架,在早期阶段融合H&E和虚拟CODEX数据。这种方法显式地建模跨模态交互和空间关系,增强了其识别与患者结局预测相关的临床特征的能力。
研究在五个独立的NSCLC队列中评估了基于MICA的风险预测的预后效用。使用来自美国国家肺部筛查试验(NLST)的数据,训练了一个模型来从H&E染色的WSI预测无复发生存期(RFS),然后在其他四个患者队列中进行测试,包括癌症基因组图谱(TCGA)、前列腺、肺、结直肠和卵巢(PLCO)癌症筛查试验、斯坦福-TMA和TA-TMA队列。Kaplan-Meier分析表明,在训练和验证队列中,风险分层均显著且稳健。MICA定义的高风险和低风险患者之间的风险比(HR)在验证队列中,对于I期NSCLC为2.43-3.33(所有P ≤ 0.002),对于II期NSCLC为2.27-4.28(所有P ≤ 0.012)。在TA-TMA队列中,对于总生存期(OS)也观察到了类似的结果。
使用一致性指数(C-index)进行的定量评估进一步证实了MICA风险模型的预后性能。对于早期疾病患者,MICA实现的C-index分别为0.80(NLST)、0.67(TCGA)、0.68(Stanford-TMA)、0.72(PLCO)和0.62(TA-TMA)。在四个验证队列中,MICA达到了总体调整后的C-index为0.68(按患者数量加权),显著优于仅使用H&E的模型(总体C-index:0.56;所有P ≤ 0.016)和仅使用虚拟CODEX的模型(总体C-index:0.59)。
MICA风险模型在早期NSCLC的预后预测方面也优于传统的临床病理学变量,包括肿瘤分期和分级。多变量Cox回归分析进一步证实,MICA衍生的风险评分是所有患者队列中临床结局(RFS、疾病特异性生存期(DSS)和总生存期)的最强独立预测因子。重要的是,将MICA衍生的评分与年龄、性别、分级和分期等标准风险因素相结合,与单独使用临床变量相比,显著提高了早期NSCLC的预后准确性(总体C-index:0.71 对 0.58;所有P ≤ 0.002)。预后准确性大幅提高22%,凸显了融合H&E图像和虚拟空间蛋白质组学在超越传统临床病理学风险因素方面提供的补充信息的价值。
额外的分析证实了其在不同疾病分期和临床亚组中的稳健性、每个队列内的交叉验证以及相对于后期融合基线(PORPOISE)在交叉验证和独立验证中的优势。此外,在12个TCGA癌症类型中,MICA在五折交叉验证下优于两个单模态基线。
为了比较虚拟空间蛋白质组学与实验获取的空间蛋白质组学的预后价值,研究将NLST训练的模型应用于两个具有匹配H&E和真实CODEX数据的独立队列(斯坦福-TMA和TA-TMA)。比较了三个模型:(1)仅使用H&E的基线;(2)使用HEX生成的虚拟CODEX的MICA(MICA-Virtual);(3)使用真实CODEX的MICA(MICA-True)。结果显示,MICA-Virtual和MICA-True模型在预后准确性方面均显著优于仅使用H&E的模型。重要的是,MICA-True和MICA-Virtual之间的C-index在任一队列中均无统计学显著差异。这些结果表明,HEX衍生的虚拟CODEX可以提供超越H&E的额外预后信息,其价值等同于真实的CODEX数据。
HEX基于预后预测的生物学解释
HEX方法不仅能够实现准确的预后预测,还能为预测背后的原因提供生物学解释。研究展示了从标准H&E图像生成的虚拟空间蛋白质组学图谱,对应于模型预测的高风险和低风险患者的关键生物标志物。这使得能够将组织形态学与空间分辨的蛋白质表达联系起来,并精确定位对患者风险贡献最大的感兴趣区域。
为了评估模型预测的生物学相关性,研究应用积分梯度方法计算了图像块水平的归因分数。然后将NLST队列中具有最高和最低积分梯度值的图像块——分别代表对模型风险预测影响最大的图像块——归类为高风险组和低风险组。在形态学上,在高风险图像块中观察到组织学模式,如低分化、淋巴血管浸润、坏死和微乳头状模式。相反,低风险图像块包括具有鳞屑样生长、高分化肿瘤、丰富的肿瘤浸润淋巴细胞和三级淋巴结构的区域——这些模式与已知的预后相关性一致。
然后,研究比较了不同风险组之间虚拟CODEX图像中的蛋白质表达谱。低风险组富含免疫标志物,如CD20、CD3e、CD8和颗粒酶B(granzyme B)。相比之下,高风险组显示增殖标志物(Ki-67)、上皮标志物(上皮细胞粘附分子(EpCAM)和广谱细胞角蛋白(PanCK))、间质标志物(α-平滑肌肌动蛋白)和血管生成标志物(CD31)的表达增加。对所有40种生物标志物的比较也提供了类似的结果。
为了进一步探索不同生物标志物的空间共定位模式,研究量化了具有生物标志物对高共表达值的图像块的比例。观察到CD3e+/PanCK+图像块的比例在低风险组中显著更高,这与上皮内免疫浸润一致。相反,高风险组表现出显著更高比例的Ki-67+/PanCK+和CD44+/EpCAM+图像块,反映了增殖性肿瘤和癌症干细胞生态位。
为了确认这些空间模式的预后意义,研究在患者水平计算了具有HEX预测的高共表达模式的图像块数量,并将患者分为高计数组和低计数组。在NLST队列中,具有高比例CD3e+/PanCK+图像块的患者具有更好的生存结局(HR = 0.58;P = 0.001),而那些具有高比例Ki-67+/PanCK+或CD44+/EpCAM+图像块的患者生存期显著更差(HR分别为1.64(P = 0.001)和1.56(P = 0.005))。为了进一步验证这些发现,研究在斯坦福-TMA队列中使用真实的CODEX图像计算了相同的空间生物标志物,并且确实在所有三种生物标志物上都观察到了相同的预后模式。总体而言,这些结果表明HEX方法有效地将组织形态学与空间分辨的蛋白质表达相结合,实现了对患者预后的具有生物学可解释性的预测。
HEX改善晚期肺癌的免疫治疗反应预测
最后,研究评估了HEX基于标准H&E染色WSI预测免疫检查点抑制剂(ICI)反应和结局的能力。研究收集了148例接受抗程序性死亡蛋白-1(PD-1)或程序性死亡配体1(PD-L1)ICI治疗的晚期NSCLC患者的数字化H&E切片、临床数据和结局。HEX被用于从H&E图像生成虚拟CODEX图谱,然后通过MICA框架将这些图谱与组织学特征整合,用于结局预测。
对于客观缓解(OR)预测,MICA实现的受试者工作特征曲线下面积(AUC)为0.82(95%置信区间(CI):0.73–0.90),显著优于仅使用H&E的模型(AUC为0.72(95% CI:0.59–0.80))和仅使用虚拟CODEX的模型(AUC为0.75(95% CI:0.62–0.84))(所有P < 0.001)。仅使用CODEX的模型的强劲表现表明,HEX推断的空间蛋白质组学捕获了决定治疗反应的关键生物学信息。MICA的表现也优于临床批准的检测方法,如PD-L1表达(AUC = 0.66;95% CI:0.54–0.77;P < 0.05)和肿瘤突变负荷(TMB)(AUC = 0.59;95% CI:0.37–0.80;P < 0.05)。
在预测无进展生存期(PFS)方面,MICA实现的C-index为0.72(95% CI:0.65–0.76),显著优于仅使用H&E的模型(C-index:0.62;95% CI:0.56–0.67)和仅使用虚拟CODEX的模型(C-index:0.66;95% CI:0.61–0.72)(所有P < 0.001)。值得注意的是,MICA在预测PFS方面也优于PD-L1和TMB等现有生物标志物。为了评估MICA是否提供额外的预测价值,研究纳入了标准临床变量,包括年龄、性别、体重指数(BMI)、中枢神经系统转移、吸烟状况和PD-L1表达。在多变量Cox回归分析中,MICA仍然是PFS最显著的独立预测因子(HR = 1.67;95% CI:1.36–2.05;P < 0.001)。
研究进一步评估了MICA对患者进行PFS分层的能力。Kaplan-Meier分析揭示了高风险组和低风险组之间的清晰分离(HR = 3.11;95% CI:2.11–4.57;P < 0.001),中位PFS时间分别为4.4个月和15.1个月。相比之下,单独使用PD-L1表达并不能显著区分患者结局。重要的是,MICA在临床相关亚组中保持了稳健的分层能力,包括PD-L1表达水平、免疫治疗线数以及ICI单药治疗与ICI联合化疗方案。这些结果共同证实了虚拟空间蛋白质组学的附加预测价值,并表明像MICA这样的有效融合策略允许基于标准组织病理学更准确地预测免疫治疗反应和结局。
HEX基于免疫治疗反应预测的生物学解释
为了更好地理解模型在免疫治疗背景下的预测,研究分析了与治疗获益相关的组织病理学推断的虚拟空间蛋白质组学谱。使用与预后解释相同的方法,根据积分梯度分数将图像块分为高风险和低风险类别。然后比较了两个风险组之间虚拟CODEX图像中的蛋白质表达值。低风险组显著富集了免疫相关标志物,如CD138、CD3e、CD8和TCF-1,而高风险组则表现出与免疫抑制或纤维化成分相关的标志物表达升高,包括CD66b、CD163、FAP和胶原蛋白IV(collagen IV)。
为了更深入地了解与免疫治疗反应相关的细胞状态,研究检查了标志物定义的免疫和基质细胞状态的分布。研究没有穷举所有可能的组合,而是采取了一种基于生物学知识的方法,重点关注六个双标志物对,基于它们已确立的功能相关性。研究发现低风险组显著富集granzyme B+/CD8+(细胞毒性效应T细胞)、TCF-1+/CD4+(辅助性T细胞)和PD-1+/CD8+(耗竭T细胞)。相比之下,高风险组富集了CD66b+/MMP9+(促肿瘤中性粒细胞)、FAP+/collagen IV+(细胞外基质重塑成纤维细胞)和CD163+/MMP9+(M2样肿瘤相关巨噬细胞),反映了两组之间不同的肿瘤微环境。
研究进一步通过评估细胞类型和状态的成对相互作用,使用归一化Jaccard指数来量化空间共定位特征(SCS)。研究发现低风险组的特征在于各种T细胞亚群的协调空间共定位,包括效应性和耗竭性T细胞以及辅助性T细胞。相比之下,高风险组表现出更强的免疫抑制性肿瘤相关巨噬细胞和中性粒细胞的共定位(CD66b+/MMP9+和CD163+/MMP9+)。为了说明这些概念,研究展示了两个模型预测的高风险和低风险患者的配对H&E和虚拟CODEX可视化示例,展示了模型如何捕获与免疫治疗反应相关的关键空间蛋白质组学特征。
最后,为了评估这些SCS的预后相关性,研究计算了每个患者每个SCS呈阳性的图像块数量,并将患者分为高计数组和低计数组。具有高计数CD66b+/MMP9+和CD163+/MMP9+SCSs的患者结局显著更差(HR = 2.38;95% CI:1.63–3.48;P < 0.001),而富含TCF-1+/CD4+和PD-1+/CD8+或granzyme B+/CD8+和PD-1+/CD8+特征的患者显示出显著改善的结局(HR分别为0.58(95% CI:0.39–0.85P = 0

生物通微信公众号
微信
新浪微博


生物通 版权所有