在计算机断层扫描(CT)中准确分割肝脏对于辅助诊断、手术规划和肝脏学中的定量评估至关重要。由于肝脏在视觉上与邻近组织相似、患者之间的解剖结构存在显著差异、成像伪影噪声以及肿瘤形态的不规则性,自动分割仍然具有挑战性。手动勾画不仅费时,而且容易受到观察者差异的影响,这突显了需要开发能够有效捕捉全局肝脏轮廓同时保持精确边界细节的先进自动化方法。
卷积神经网络(CNN)在医学图像分割方面取得了显著进展。Ronneberger等人[1]引入了U-Net,这是一种具有跳跃连接的编码器-解码器框架,它结合了局部和上下文特征,为医学图像分割树立了基准[2]。在此基础上,密集连接模型[3]通过引入残差连接来增强梯度流动和肝脏及肿瘤勾画的准确性。nnU-Net[4]通过自动配置预处理、架构参数和训练策略,适应了多种数据集,实现了无需手动调整的最先进性能。Tong等人[5]通过结合粗略定位和精细分割的两阶段框架,解决了多中心和多阶段数据集的复杂性,而Sun等人[6]通过补充的特征增强单元和交叉注意力机制提高了CT扫描中肝脏边界的精度。
尽管取得了这些进展,基于CNN的编码器-解码器模型通过迭代下采样来扩大感受野以捕捉空间上下文,但经常牺牲了精确的边界细节。频域分析作为一种有效方法应运而生。傅里叶变换[7]能够捕获全局频谱信息,但忽略了空间局部性,从而限制了边界精度。Li等人[8]引入了Wavelet U-Net,利用离散小波变换(DWT)进行下采样,逆小波变换(IWT)进行上采样,以保持结构边界的完整性。Zhao等人[9]引入了WRANet,将残差注意力与小波分解集成到低频和高频子带中,同时处理结构和详细特征,从而提高了鲁棒性。Pan等人[10]开发了一种用于脑肿瘤分割的小波融合多编码器U-Net,重点关注高频纹理特征和边界精细化,这些技术也适用于肝脏分割。Rhyou等人[11]通过将DWT与深度学习框架结合,展示了小波网络在超声图像中自动进行肝细胞癌分割的有效性,为肝脏分割提供了相关见解。
然而,现有方法存在一些局限性:(1)肝脏在视觉上与邻近器官和病理结构高度相似,这使得仅依赖空间域卷积的模型难以准确定位边界。(2)许多现有方法侧重于空间或高频线索,而忽略了捕捉肝脏轮廓所需的低频成分。传统的小波基模型还依赖于手动选择的小波和固定参数。(3)当前的架构未能充分整合全局上下文特征与局部结构细节,导致在多尺度融合过程中精细边界的保存效果不佳。
为了解决这些问题,我们提出了LWT-Net,这是一种基于提升小波变换的CT肝脏分割网络,它结合了我们之前的工作[12]中的可训练频域建模和自适应频域-空间融合。与传统的小波基分割网络不同,LWT-Net将提升小波直接嵌入到深度特征空间中,实现了端到端的学习特征图分解和重建。通过分裂-预测-更新操作,所提出的可训练LWT根据特定任务的优化目标动态分离低频和高频成分,使网络能够同时捕捉全局结构上下文和精确的边界信息。此外,LWT-Net引入了基于直方图注意力(FSF-HA)的频域-空间融合模块,这与现有的注意力机制有根本不同。FSF-HA不是均匀地重新加权特征,而是将特征表示明确分离为高信息成分和低信息成分,并执行直方图引导的空间-频率重组。具体来说,提出的LWT-Encoder结合了卷积特征提取器和前向提升小波变换(For-LWT),以适应性地提取高频通道中的判别性边界线索,同时保持语义丰富的低频表示。进一步使用逆提升小波变换(Inv-LWT)通过逆预测-逆更新-合并操作重建高分辨率特征,确保了跨尺度的空间一致性和最小的信息损失。我们的主要贡献总结如下:
- 1.
我们提出了LWT-Net,这是一种基于提升小波变换的CT肝脏分割网络。通过利用提升小波变换将特征图分解为低频和高频成分,该网络实现了有效的多尺度频域特征提取,增强了全局结构表示和局部边界保留。
- 2.
LWT-Encoder利用前向提升小波变换(For-LWT)通过分裂-预测-更新操作自适应地分解特征图,在高频通道中捕捉精确的边界细节,同时保持语义丰富的低频成分。逆LWT(Inv-LWT)通过逆预测-逆更新-合并操作重建高分辨率特征,确保了鲁棒的多尺度表示和边界精度。
- 3.
我们开发了一个基于直方图注意力的频域-空间融合模块,它将特征分离为高信息成分和低信息成分,并应用直方图引导的空间-频率重组。通过整合全局依赖性的空间分布重组和局部频率重组以获得精确的边界细节,FSF-HA模块增强了解剖区域聚焦并提高了肝脏分割的全局一致性。
- 4.
在三个公开基准数据集LiTS2017、WORD和FLARE22上的全面实验表明,LWT-Net的平均Dice系数分别达到了95.96%、97.15%和95.97%,超过了现有的最先进肝脏分割方法。