超声图像中甲状腺结节的精确分割对于可靠的计算机辅助诊断至关重要,但由于斑点噪声、低对比度、病灶外观异质性以及边界不清晰,该任务仍然具有挑战性。为解决这些局限性,研究人员提出了RCGA-UNet-DS(Residual Cross-Gated Aggregation U-Net with Deep Supervision,带深度监督的残差交叉门控聚合U-Net),这是一种全卷积(fully convolutional)分割架构,旨在在不依赖Transformer模块或空洞卷积(dilated convolutions)的前提下,增强多尺度上下文推理能力和边界判别能力。所提出的网络采用六阶段编码器-解码器结构,集成了残差双卷积编码器块、注意力引导的交叉门控跳跃连接,以及跨尺度全局上下文(Cross-Scale Global Context,CSGC)模块。CSGC组件利用全局平均池化(global average pooling)从多个编码器深度聚合全局描述符,并将其投影到共享潜在空间中,从而实现跨尺度编码器特征的通道级自适应调制。此外,四个深度监督分支被附加到中间解码器层级,以稳定优化过程并改善梯度传播。该网络采用由Dice、二元交叉熵(binary cross-entropy,BCE)和边界感知项组成的混合损失进行优化。在两个公开甲状腺超声数据集TN3K和预处理版本的DDTI上,基于统一预处理流程并将灰度输入调整为384 × 384开展的实验表明,该方法具有较强的分割性能。在TN3K测试集上,模型获得了0.8461的Dice分数和0.7661的IoU;在DDTI上,获得了0.9042的Dice分数和0.8291的IoU;在UDIAT上,取得了0.7751的Dice分数。这些结果表明,RCGA-UNet-DS能够有效捕获多尺度上下文信息,并在保持计算效率的同时,实现对甲状腺结节的精确勾画。
该文发表于《Biomedical Signal Processing and Control》,围绕甲状腺结节超声图像自动分割这一医学图像分析问题展开。研究背景在于,超声(ultrasound,US)因成本低、无电离辐射、临床可及性高而成为甲状腺筛查首选成像方式,但B-mode超声成像存在严重斑点噪声、声影、组织间低对比度以及回声密度不均等问题,导致结节边界模糊、形态不规则、病灶内部异质性显著,进而增加人工勾画的主观性和耗时性,也限制了计算机辅助诊断、恶性风险评估及长期体积随访的准确性与可重复性。既往U-Net、ResUNet、ResUNet++、V-Net及CNN-Transformer混合模型虽推动了像素级分割发展,但在TN3K和DDTI等真实甲状腺超声基准上,仍普遍面临多尺度上下文整合不足、边界恢复能力有限,以及高性能方法常伴随较高计算复杂度的问题。因此,开展一种不依赖Transformer、同时兼顾上下文表征、边界判别与计算效率的分割框架,具有明确的方法学价值和应用意义。
基于上述问题,研究人员提出RCGA-UNet-DS(Residual Cross-Gated Aggregation U-Net with Deep Supervision,带深度监督的残差交叉门控聚合U-Net)。该模型是全卷积编码器-解码器架构,核心目标是在不使用自注意力(self-attention)与空洞卷积的条件下,通过跨尺度上下文聚合与门控特征重标定提升甲状腺结节分割质量。论文指出,甲状腺超声分割性能的关键不一定在于Transformer本身,而更在于上下文融合与边界区分能力。围绕这一认识,研究人员构建了六阶段编码器-解码器网络,在编码端采用残差双卷积块以强化特征提取与训练稳定性;在跳跃连接中引入注意力引导的交叉门控机制,以改善编码器与解码器之间的特征筛选和信息传递;同时设计跨尺度全局上下文(Cross-Scale Global Context,CSGC)模块,通过聚合多个编码深度的全局统计信息,在共享潜在空间内进行通道级调制,从而提升网络的多尺度语义整合能力。进一步地,研究人员在多个中间解码层添加深度监督分支,以优化梯度传播并稳定训练过程,尤其有助于复杂边界和弱对比病灶的学习。