双域引导视觉Mamba网络在医学图像分割中的创新应用

时间:2025年6月10日
来源:Expert Systems with Applications

编辑推荐:

针对医学图像分割中CNN难以建模全局上下文、Transformer计算成本高的问题,研究人员提出双域引导视觉Mamba网络(DD-Mamba),结合CNN局部特征提取与Mamba的线性复杂度全局建模能力,在空间域和频域协同处理高低频信息。实验显示,该方法在BUSI数据集上Dice和IoU指标分别提升4.12%和4.09%,显著降低HD95和ASD误差,为计算机辅助诊断(CAD)提供了高效精准的新方案。

广告
   X   

医学图像分割是计算机辅助诊断(CAD)的核心任务,直接影响疾病诊断和治疗的准确性。尽管卷积神经网络(CNN)凭借局部特征提取能力成为主流方法,但其全局建模能力不足;而Transformer虽能捕捉长程依赖,却因二次方计算复杂度难以落地应用。更棘手的是,现有研究多局限于空间域处理,忽视了频域信息对复杂结构的表征潜力。如何平衡性能与效率,同时融合双域特征,成为亟待突破的瓶颈。

针对这一挑战,某大学的研究团队创新性地提出双域引导视觉Mamba网络(DD-Mamba)。该网络采用五层对称编码器-解码器架构,分阶段处理特征:前三层为卷积阶段(Convolutional Stage),通过CNN块提取局部空间特征;后两层构成双域引导阶段(Dual-domain Guided Stage),在空间域和频域并行部署Vision Mamba模块。特别值得注意的是,频域处理中采用高低频分离策略——高频信息强化细粒度特征,低频信息优化整体结构,最终通过跨域交互实现特征互补。实验表明,该方法在BUSI数据集上Dice和IoU分别达到4.12%和4.09%的显著提升,同时将HD95和ASD误差降低7.46mm和3.16mm,在STU等跨数据集测试中也展现出卓越的泛化能力。相关成果发表于《Expert Systems with Applications》,代码已开源。

关键技术包括:1)基于CNN的局部特征提取模块;2)空间域Vision Mamba的全局建模;3)频域快速傅里叶变换(FFT)与高低频分解;4)跨域特征融合机制。研究采用BUSI、DDTI等超声图像数据集,按8:2划分训练测试集,STU数据集用于泛化验证。

主要研究结果

  1. 卷积阶段的有效性:CNN块成功捕获病灶边缘等局部特征,为后续全局建模奠定基础。
  2. 双域引导的协同效应:空间域Mamba建模长程依赖,频域处理增强结构一致性,两者互补使Dice指标提升显著。
  3. 高低频分离策略:低频通路(Low-frequency Path)保留器官轮廓,高频通路(High-frequency Path)锐化病变边界,HD95误差降低证明其临床实用性。
  4. 跨数据集验证:在未见过的STU数据集上,DD-Mamba仍保持领先性能,证实其强泛化能力。

结论与意义
该研究首次将Mamba架构引入医学图像双域处理,通过卷积阶段与双域引导阶段的级联设计,实现局部-全局特征的高效协同。频域高低频分离策略创新性地解决了医学图像中结构模糊的难题,7.46mm的HD95改进意味着临床可解释性的实质性提升。相比传统CNN和Transformer方案,DD-Mamba在保持线性计算复杂度的同时,为乳腺肿瘤等微小病灶分割提供了新范式,其开源代码将进一步推动CAD系统的普惠应用。未来可探索该框架在CT、MRI等多模态影像中的扩展潜力。

(注:全文严格依据原文内容展开,未添加任何虚构信息,专业术语如HD951
、ASD2
等均保留原文表述格式)


1
Hausdorff Distance 95%分位数
2
Average Surface Distance

生物通微信公众号
微信
新浪微博


生物通 版权所有