基于提升小波变换和直方图注意力机制的网络，在CT扫描中用于肝脏分割

生物通首页 > 今日动态 > 正文

基于提升小波变换和直方图注意力机制的网络，在CT扫描中用于肝脏分割

时间：2026年1月20日

来源：Information Fusion

编辑推荐：

精准肝脏CT分割方法通过可训练小波变换与频率-空间融合机制实现高效边界检测与全局结构建模。

刘华祥|孙伟|傅友尧|张世清|金杰|方江雄|王斌良

中国浙江省台州市台州大学第一人民医院，31800

摘要

在计算机断层扫描（CT）中准确分割肝脏对于肝细胞癌的诊断和手术规划至关重要；然而，手动勾画不仅费时，而且容易受到操作者差异的影响。现有的深度学习方法在扩大感受野时往往牺牲了边界勾画的精度，或者未能利用编码全局形状的频域线索，而传统的注意力机制在处理低对比度图像时效果较差。为了解决这些问题，我们提出了LWT-Net，这是一种基于可训练的提升小波变换的网络，它结合了频域直方图注意力机制来增强肝脏分割能力。LWT-Net在编码器-解码器框架内嵌入了可训练的提升小波变换，将特征分层分解为捕获全局结构的高频成分和保留边缘及纹理细节的低频成分。一个互补的逆提升阶段在保持空间一致性的同时重建高分辨率特征。频域-空间融合模块由基于直方图的注意力机制驱动，执行全局和局部区间内的直方图引导的特征重组，并利用自注意力来捕捉长距离依赖性并优先处理解剖学上重要的区域。在LiTS2017、WORD和FLARE22数据集上的全面评估证实了LWT-Net的优越性能，平均Dice相似系数分别达到了95.96%、97.15%和95.97%。

引言

在计算机断层扫描（CT）中准确分割肝脏对于辅助诊断、手术规划和肝脏学中的定量评估至关重要。由于肝脏在视觉上与邻近组织相似、患者之间的解剖结构存在显著差异、成像伪影噪声以及肿瘤形态的不规则性，自动分割仍然具有挑战性。手动勾画不仅费时，而且容易受到观察者差异的影响，这突显了需要开发能够有效捕捉全局肝脏轮廓同时保持精确边界细节的先进自动化方法。

卷积神经网络（CNN）在医学图像分割方面取得了显著进展。Ronneberger等人[1]引入了U-Net，这是一种具有跳跃连接的编码器-解码器框架，它结合了局部和上下文特征，为医学图像分割树立了基准[2]。在此基础上，密集连接模型[3]通过引入残差连接来增强梯度流动和肝脏及肿瘤勾画的准确性。nnU-Net[4]通过自动配置预处理、架构参数和训练策略，适应了多种数据集，实现了无需手动调整的最先进性能。Tong等人[5]通过结合粗略定位和精细分割的两阶段框架，解决了多中心和多阶段数据集的复杂性，而Sun等人[6]通过补充的特征增强单元和交叉注意力机制提高了CT扫描中肝脏边界的精度。

尽管取得了这些进展，基于CNN的编码器-解码器模型通过迭代下采样来扩大感受野以捕捉空间上下文，但经常牺牲了精确的边界细节。频域分析作为一种有效方法应运而生。傅里叶变换[7]能够捕获全局频谱信息，但忽略了空间局部性，从而限制了边界精度。Li等人[8]引入了Wavelet U-Net，利用离散小波变换（DWT）进行下采样，逆小波变换（IWT）进行上采样，以保持结构边界的完整性。Zhao等人[9]引入了WRANet，将残差注意力与小波分解集成到低频和高频子带中，同时处理结构和详细特征，从而提高了鲁棒性。Pan等人[10]开发了一种用于脑肿瘤分割的小波融合多编码器U-Net，重点关注高频纹理特征和边界精细化，这些技术也适用于肝脏分割。Rhyou等人[11]通过将DWT与深度学习框架结合，展示了小波网络在超声图像中自动进行肝细胞癌分割的有效性，为肝脏分割提供了相关见解。

然而，现有方法存在一些局限性：（1）肝脏在视觉上与邻近器官和病理结构高度相似，这使得仅依赖空间域卷积的模型难以准确定位边界。（2）许多现有方法侧重于空间或高频线索，而忽略了捕捉肝脏轮廓所需的低频成分。传统的小波基模型还依赖于手动选择的小波和固定参数。（3）当前的架构未能充分整合全局上下文特征与局部结构细节，导致在多尺度融合过程中精细边界的保存效果不佳。

为了解决这些问题，我们提出了LWT-Net，这是一种基于提升小波变换的CT肝脏分割网络，它结合了我们之前的工作[12]中的可训练频域建模和自适应频域-空间融合。与传统的小波基分割网络不同，LWT-Net将提升小波直接嵌入到深度特征空间中，实现了端到端的学习特征图分解和重建。通过分裂-预测-更新操作，所提出的可训练LWT根据特定任务的优化目标动态分离低频和高频成分，使网络能够同时捕捉全局结构上下文和精确的边界信息。此外，LWT-Net引入了基于直方图注意力（FSF-HA）的频域-空间融合模块，这与现有的注意力机制有根本不同。FSF-HA不是均匀地重新加权特征，而是将特征表示明确分离为高信息成分和低信息成分，并执行直方图引导的空间-频率重组。具体来说，提出的LWT-Encoder结合了卷积特征提取器和前向提升小波变换（For-LWT），以适应性地提取高频通道中的判别性边界线索，同时保持语义丰富的低频表示。进一步使用逆提升小波变换（Inv-LWT）通过逆预测-逆更新-合并操作重建高分辨率特征，确保了跨尺度的空间一致性和最小的信息损失。我们的主要贡献总结如下：

1.
我们提出了LWT-Net，这是一种基于提升小波变换的CT肝脏分割网络。通过利用提升小波变换将特征图分解为低频和高频成分，该网络实现了有效的多尺度频域特征提取，增强了全局结构表示和局部边界保留。
2.
LWT-Encoder利用前向提升小波变换（For-LWT）通过分裂-预测-更新操作自适应地分解特征图，在高频通道中捕捉精确的边界细节，同时保持语义丰富的低频成分。逆LWT（Inv-LWT）通过逆预测-逆更新-合并操作重建高分辨率特征，确保了鲁棒的多尺度表示和边界精度。
3.
我们开发了一个基于直方图注意力的频域-空间融合模块，它将特征分离为高信息成分和低信息成分，并应用直方图引导的空间-频率重组。通过整合全局依赖性的空间分布重组和局部频率重组以获得精确的边界细节，FSF-HA模块增强了解剖区域聚焦并提高了肝脏分割的全局一致性。
4.
在三个公开基准数据集LiTS2017、WORD和FLARE22上的全面实验表明，LWT-Net的平均Dice系数分别达到了95.96%、97.15%和95.97%，超过了现有的最先进肝脏分割方法。

部分摘录

基于深度学习的方法用于肝脏分割

深度学习，特别是卷积神经网络（CNN），在肝脏分割领域取得了革命性进展。Zhou等人[3]率先提出了结合3D条件随机场（CRFs）的级联U-Net架构，提高了肝脏肿瘤分割的边界精度。Isensee等人[4]引入了nnU-Net，这是一个自适应框架，优化了网络架构和训练策略，在2018年的MICCAI肝脏肿瘤分割挑战赛中表现出色

提升小波变换

二维小波变换（2D-WT）是一种强大的多尺度信号分析工具，它将输入图像分解为不同频率和方向的子带，有效捕捉了空间和频率信息。这使得它非常适合分析非平稳信号，如CT扫描中肝脏区域的复杂纹理和边界特征。与优先考虑频率信息而牺牲空间细节的傅里叶变换不同，2D-WT

数据集

我们在三个公开可用的肝脏分割基准数据集上评估了LWT-Net：全腹部器官数据集（WORD）[31]、2017年肝脏肿瘤分割基准数据集（LiTS2017）[32]和2022年快速低资源腹部器官分割数据集（FLARE22）[33]。体积CT扫描被转换为2D轴向切片，以满足网络的训练和推理要求。预处理流程包括使用Hounsfield单位（HU）进行归一化，以标准化强度范围