在精准医疗时代,结直肠癌(Colorectal Cancer, CRC)作为全球高发恶性肿瘤,其病理学评估的精确性直接关系到治疗策略制定和预后判断。其中,肿瘤出芽(Tumor Budding, TB)——定义为肿瘤浸润前沿不超过4个细胞构成的微小细胞簇——已被国际共识确认为关键预后指标。然而,传统的TB分级评估存在显著瓶颈:病理医师需在H&E染色全切片图像(Whole Slide Images, WSIs)中人工定位肿瘤浸润前沿,在0.785 mm2 热点区域内计数出芽数量,整个过程不仅耗时(每例约1-2分钟),且因主观判断差异导致评估结果一致性低(Inter-observer Variability)。
现有基于人工智能的自动化方案多数存在明显局限:免疫组化染色方案虽提高识别度但增加医疗成本,而基于单中心数据的深度学习模型泛化能力不足。更关键的是,面对不规则肿瘤形态和复杂间质背景时,现有模型难以精准界定肿瘤浸润边界,导致TB计数误差。这些痛点催生了对兼具准确性、效率与泛化能力的全自动标注系统的迫切需求。
针对这一挑战,Peng等人在《npj Precision Oncology》发表的研究提出了一种创新性的双模型协作框架。该研究通过肿瘤与正常组织分类模型(Tumor and Normal Tissue Classification Model, TNTCM)实现浸润前沿边界精准提取,结合专门针对肿瘤浸润前沿区域的出芽标注模型(TB Annotation Model for Tumor Invasive Front Patches, TBAM-TIFP),最终通过坐标映射实现全切片级别的TB自动化标注。该系统在内部验证集(PUTH-IV)和外部验证集(TCGA-COAD-EV、TCGA-READ-EV)上均表现出色,将TB分级评估时间缩短70%以上,且生存分析证实其辅助分级结果与患者预后显著相关。
研究方法的核心技术路径包括:首先采用类CLAM预处理流程将WSIs分割为2048×2048像素的 patches,通过ResNet34架构的TNTCM实现基于绝对坐标的 patch级分类,进而通过邻域分析确定浸润边界;随后在边界区域内应用基于YOLOv8框架的TBAM-TIFP进行出芽检测,设定IoU≥0.7且置信度>0.4的检测阈值;最后通过坐标转换算法将 patch级标注映射回全切片空间。研究队列包含来自华中科技大学协和医院病理科的内部数据集(356例开发集+184例验证集)及TCGA公共数据库的外部验证集(362例结肠癌+139例直肠癌)。
肿瘤浸润前沿边界提取性能
TNTCM在三个数据集上展现出稳定的边界识别能力。如表1所示,在内部验证集PUTH-IV上特异性达0.951(95% CI: 0.934-0.968),敏感性0.935(95% CI: 0.915-0.955),AUC高达0.988。即使在外部验证集TCGA-READ-EV上,尽管特异性降至0.733,敏感性仍保持0.929,AUC为0.929,表明模型对肿瘤组织的识别鲁棒性。与INSIGHT、CLAM等主流多示例学习模型相比,TNTCM凭借 patch级监督学习策略实现显著性能提升(p<0.05)。
肿瘤出芽标注模型效能
TBAM-TIFP在肿瘤浸润前沿 patches中的标注性能如图6和表2所示。在PUTH-IV上召回率0.850,精确度0.792,F1分数0.820;外部数据集上虽有所下降(TCGA-COAD-EV召回率0.753,TCGA-READ-EV召回率0.720),但仍显著优于GLEE、Faster R-CNN等通用目标检测模型。定性分析显示(图8),模型在内部数据中可实现与病理医师完全一致的标注(3/3 TBs),但在外部数据中因TB形态变异和染色差异存在漏标现象(TCGA-COAD-EV:9/13 TBs)。
全切片标注临床应用价值
全自动标注辅助(Full-Automated Annotation Assistance, FAAA)将单张WSI的TB分级时间从人工评估的50-89秒压缩至15-21秒(表3)。如图9所示,虽然存在将间质肿瘤细胞误判为TB的假阳性现象,但通过病理医师最终审核,这些错误未影响分级结果。生存分析(图10)证实,基于FAAA的Bd3(高风险)患者与低风险组别生存曲线分离明显(p<0.05),但在Bd1与Bd2组间存在重叠,提示模型对低分级TB的鉴别精度仍需优化。
该研究的创新性在于首次构建了端到端的TB全自动标注流水线,通过解剖学引导的级联策略(先定位浸润前沿再检测出芽)显著提升可解释性。双模型协作机制既克服了单一模型对复杂组织结构的适应不足,又通过坐标映射保持空间一致性。值得注意的是,虽然模型在外部验证中表现出一定性能衰减,但其在TCGA多中心数据上的稳定性已优于多数既往研究。
讨论部分指出,当前系统的局限性主要源于三方面:TNTCM对异质性样本的泛化能力仍需加强;TBAM-TIFP对特殊形态TB的漏标问题;以及假阳性标注对低分级病例生存曲线分辨度的干扰。未来工作应聚焦于增加训练样本多样性,引入对抗训练提升域适应能力,并开发更精细的TB亚型判别算法。
综上所述,这项研究为CRC病理智能化诊断提供了重要技术支撑。其价值不仅体现在显著提升TB评估效率,更在于建立了可扩展的标注框架,为其他肿瘤的微环境分析树立了新范式。随着数字病理与人工智能的深度融合,这种融合算法创新与临床需求的研发思路,将加速精准病理学从概念走向常规应用的进程。
打赏