结合注意力机制与图像降采样的高效深度神经网络在结直肠癌病理检测中的应用

时间：2025年10月23日

来源：Scientific Reports

编辑推荐：

本研究针对结直肠癌病理诊断耗时且依赖专家经验的问题，开发了基于多示例学习（MIL）和注意力机制的深度神经网络模型。通过系统评估不同图像分辨率（2-16μm/pix）对模型性能的影响，发现4μm/pix分辨率下在TCGA测试集上达到F1-Score 0.96、MCC 0.92和AUROC 0.99的优异指标。该研究创新性地实现了全切片图像（WSI）级别的肿瘤检测与定位，为降低计算成本同时保持诊断精度提供了重要解决方案。

在当今医疗领域，结直肠癌（Colorectal Cancer, CRC）作为全球发病率第二的恶性肿瘤，其早期诊断直接关系到治疗效果和患者生存率。然而传统病理诊断存在明显瓶颈：专业病理医生需要耗费大量时间进行显微镜观察，诊断结果易受主观因素影响，且医疗资源分布不均导致诊断质量参差不齐。随着数字病理技术的普及，全切片图像（Whole-Slide Images, WSI）为人工智能辅助诊断提供了新的机遇，但海量的图像数据（单张WSI可达1.5GB）对计算资源提出了严峻挑战。

《Scientific Reports》最新发表的研究通过创新性的深度学习框架，成功解决了这一难题。研究团队开发了结合多示例学习（Multiple-Instance Learning, MIL）和注意力机制（Attention Mechanism）的端到端深度学习管道，系统探索了图像分辨率与模型性能的平衡点，在显著降低计算成本的同时实现了卓越的肿瘤检测精度。

关键技术方法包括：1）基于MECC队列（n>1300）和TCGA队列（n=1349）的WSI数据预处理与颜色标准化；2）多分辨率级别（2/4/8/16μm/pix）的对比实验设计；3）ResNet50特征提取器与注意力聚合模块的集成架构；4）五折交叉验证与超参数优化策略。

模型性能与分辨率关系

研究发现4μm/pix分辨率下模型达到最优性能（MCC=0.943，F1_Macro=0.971），较最高分辨率（2μm/pix）显著提升计算效率。值得注意的是，即使最低分辨率（16μm/pix）仍保持MCC=0.895的可靠性能，证明适度降低分辨率可行。

注意力机制的可解释性价值

通过注意力权重生成肿瘤热力图，模型不仅能准确识别癌变区域（如异常黏膜组织），还能揭示潜在诊断偏差。例如发现炎症反应区域（淋巴细胞浸润）可能引发假阳性，但同时成功识别出数据集中存在的错误标注样本。

跨队列验证与消融实验

模型在内部测试（MECC）和外部验证（TCGA）中分别达到AUROC 0.989±0.006和0.981±0.008，证明其强泛化能力。消融实验显示注意力池化比平均池化显著提升MCC 21.6%，而颜色标准化是模型有效性的关键前提。

研究结论强调，4μm/pix分辨率可实现计算效率与诊断精度的最优平衡，注意力机制既提升性能又提供可解释性依据。该技术框架有望推动计算病理学的临床应用，通过降低硬件门槛使AI辅助诊断更易普及。未来通过整合多中心数据和自监督学习（Self-Supervised Learning, SSL）技术，将进一步增强模型鲁棒性和发现新生物标志物的能力。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部