在女性健康领域,乳腺癌如同潜伏的 “杀手”,严重威胁着众多女性的生命。据世界卫生组织数据,2022 年全球有 230 万女性被诊断出患有乳腺癌,67 万人因此失去生命。在乳腺癌的诊疗过程中,组织病理学检查起着关键作用,其中诺丁汉组织学分级的一项重要指标 —— 有丝分裂计数,却面临诸多难题。有丝分裂计数需要病理学家花费大量时间去识别和量化,不仅过程繁琐、耗时,还具有很强的主观性,不同病理学家之间、甚至同一病理学家不同次判读结果都可能存在较大差异 。这就好比在黑暗中摸索,缺乏精准度和一致性,使得有丝分裂计数难以成为可靠的诊断依据,进而影响乳腺癌的精准医疗。
为了突破这一困境,来自远东纪念医院(位于中国台湾新北市)的研究人员展开了深入研究。他们致力于开发一种基于人工智能(AI)的工作流程,用于乳腺癌图像的有丝分裂自动评分,期望借此提升诊断的准确性和效率,为乳腺癌的精准治疗提供有力支持。经过一系列研究,他们取得了令人瞩目的成果,相关论文发表在《Clinical Breast Cancer》杂志上。
研究人员在开展研究时,主要运用了以下关键技术方法:首先,收集了 93 例患者的 117 张全切片图像(WSI),其中 97 张用于训练有丝分裂检测模型,为模型学习提供丰富的数据基础。其次,利用磷酸组蛋白 H3(PHH3)免疫组化(IHC)染色结果引导注释构建辅助标签模型,让模型学习更准确的有丝分裂特征;同时采用交互式学习方法扩充数据集,提升模型性能。最后,构建自动评分框架,涵盖图像分区、上皮区域分割、有丝分裂检测、热点分析和评分分类等步骤,实现有丝分裂的自动评分。
研究结果
- 有丝分裂模型性能:在数据集 1 和 2 的测试集中,模型的召回率、精度和 F1 评分分别为 0.7739、0.7292 和 0.7509 。这表明模型具备良好的性能,即使在图像稍有模糊的情况下,也能识别不同阶段的有丝分裂。但模型也存在一些不足,会误认如固缩核或中性粒细胞等类似有丝分裂的结构,偶尔还会遗漏一些难以判断的有丝分裂。将模型应用于公开的 MIDOG 2021 数据集时也有类似情况。
- 自动评分工作流程效果:自动评分工作流程通过全面分析整张切片来定位热点区域,这一创新举措显著提高了病理学家之间的一致性。不过,该流程在有丝分裂评分上存在轻微低估的情况。此外,使用该自动评分系统后,每份病例的阅片时间从平均 452 秒大幅缩短至 52 秒,效率得到极大提升 。
研究结论与讨论
研究人员通过 PHH3 IHC 引导注释和交互式学习训练出有丝分裂模型,并设计出自动估计乳腺癌 H&E 图像有丝分裂评分的工作流程。该框架有效提高了观察者之间的一致性和工作效率,为病理医生提供了有力的辅助工具。然而,传统手动评估和先进的 AI 辅助评估之间仍存在评分不一致的问题。未来,还需要纳入更多病例并开展预后相关性研究,以建立基于 AI 评估有丝分裂活性的新方法。
这项研究意义重大,它首次将 AI 技术与乳腺癌有丝分裂评分相结合,为解决长期以来手动评分的难题提供了创新方案。提高的诊断一致性和效率,有助于减少误诊、漏诊,让更多乳腺癌患者能及时得到准确诊断和有效治疗。同时,该研究也为数字病理学的发展指明了方向,推动了 AI 技术在医学领域的深度应用,为精准医疗时代的到来奠定了坚实基础。