卵巢癌亚型分类:组织病理学基础模型带来新曙光

时间:2025年2月1日
来源:npj Precision Oncology

编辑推荐:

卵巢癌组织学亚型分类困难,影响诊断效率与患者预后。研究人员开展卵巢癌亚型分类的组织病理学基础模型研究。结果显示,多数基础模型优于传统特征提取器,H-optimus-0 表现最佳。这为卵巢癌诊断提供新途径,有望提升诊断准确性与效率。

广告
   X   

卵巢癌是全球女性中常见且预后较差的癌症,每年有大量新增病例和死亡人数。其包含多种组织学亚型,不同亚型的预后和治疗方案差异显著,准确的组织学亚型分类在诊断过程中至关重要。然而,目前病理学家仅依据苏木精 - 伊红(H&E)染色组织切片进行诊断时,一致性仅约 80% 。在诊断不确定时,往往需要进行辅助检测或寻求专家二次诊断,这不仅增加了后勤和经济负担,还可能因诊断资源不足导致治疗延迟,严重影响患者预后。
在此背景下,人工智能(AI)技术有望为病理学家提供二次诊断意见,优化诊断流程。但现有的卵巢癌 AI 诊断模型大多处于小规模原型阶段,尚未获得欧美临床使用的监管批准,且模型准确性有待提高,缺乏充分的真实世界测试。

为了解决这些问题,英国利兹大学(University of Leeds)的研究人员开展了一项全面评估组织病理学基础模型用于卵巢癌亚型分类的研究。该研究成果发表在《npj Precision Oncology》杂志上。

研究人员采用的主要技术方法如下:

  1. 数据收集:回顾性收集了 1864 例卵巢癌福尔马林固定石蜡包埋(FFPE)附件组织全切片图像(WSI)作为训练集,来自 434 例患者;独立的内部保留测试集包含 100 例患者的 WSI;还使用了两个外部测试集,即 Transcanadian Study 数据集(80 例患者的 WSI)和 OCEAN Challenge 数据集(513 例 WSI)。
  2. 模型构建与训练:使用基于注意力的多实例学习(ABMIL)分类管道进行幻灯片分类。比较了 17 种补丁特征提取器,包括 3 种 ImageNet 预训练模型和 14 种组织病理学基础模型。对 ABMIL 分类器进行超参数调优,通过五折交叉验证、保留测试和外部验证评估模型性能。

研究结果如下:

  1. 基础模型性能:不同模型在不同验证中的表现各异,没有单一模型在所有验证中均表现最佳。H-optimus-0 模型在所有验证中的平均性能最佳,其平均平衡准确率为 83.0%,平均 AUROC 为 0.965,平均 F1 分数为 0.822 。除 RN18-Histo 外,大多数基础模型在所有验证指标上均显著优于基线 ImageNet 预训练的 ResNet50 模型。
  2. 预处理效果:不同的预处理技术对基线 ResNet50 特征提取器的影响不一致。在内部验证和 OCEAN Challenge 验证中影响较小,但在 Transcanadian Study 数据集验证中对模型泛化有一定帮助。没有一种预处理方法能始终提高模型性能。
  3. 超参数调优影响:超参数调优对 ABMIL 分类器的性能有显著影响,平均平衡准确率提高了 1.9% ,但不同模型的提升效果存在差异。部分模型如 ResNet50、ResNet18、Phikon 和 H-optimus-0 在超参数调优后未获得性能提升。

研究结论与讨论:
本研究表明,基于 Transformer 的组织病理学基础模型在卵巢癌亚型分类的下游任务中,相较于非领域特定和基于 ResNet 的特征提取器,显著提高了分类性能。模型性能与模型大小和预训练数据集大小存在一定的正相关关系,但并不绝对,如 UNI 模型在相对较小的预训练数据集和模型大小下仍表现出色,且计算效率更高。

不同预处理技术对模型性能的影响有限,选择最佳的特征提取器比应用多样的预处理技术更有价值。超参数调优虽能提高模型性能,但效果因模型而异,调整学习率和 ABMIL 分类器大小是提高模型性能和验证稳健性的更有效计算方法。

尽管组织病理学基础模型在卵巢癌亚型分类中表现出巨大潜力,但仍面临一些挑战。例如,模型需要更好地泛化到不同的组织病理学实验室和幻灯片扫描仪,应增强对低质量数据和伪影的鲁棒性,提高对治疗后组织的准确分类能力。此外,如何将模型生成的信息更好地呈现给病理学家,辅助其诊断,也是未来需要解决的问题。

总的来说,这项研究为卵巢癌的诊断提供了新的思路和方法,组织病理学基础模型有望在未来临床实践中发挥重要作用,但仍需进一步的研究和改进,以实现其临床应用的最终目标。

生物通微信公众号
微信
新浪微博


生物通 版权所有