DP-UNet：一种基于双分支注意力机制的多层编码器与渐进式融合金字塔池化网络，用于COVID-19感染区域的分割

时间：2026年2月3日

来源：Biomedical Signal Processing and Control

编辑推荐：

计算机辅助诊断成像在COVID-19检测中起关键作用，但CT图像复杂且与肺炎特征相似，导致可靠诊断困难。传统U-Net模型存在上下文信息丢失和语义断层问题。本文提出DP-UNet，通过双分支注意力编码器增强语义信息提取，并设计渐进融合金字塔池化模块整合多尺度特征，有效提升肺病变边界划分精度和感染区域多尺度细节保留，参数增量少。实验显示在COVID-19 CT数据集上Dice系数达0.8459和0.7758，优于对比模型。

王文峰|毛琪|田毅|王金涛|向振武|张艳

上海工程技术大学电子与电气工程学院，中国上海201620

摘要

计算机辅助诊断成像在检测2019冠状病毒病（COVID-19）中发挥着关键作用。COVID-19与普通肺炎具有相似的特征，加之CT成像的复杂性，使得可靠诊断变得具有挑战性。虽然U-Net在医学图像分割中得到了广泛应用，但其编码器池化和解码器上采样过程常常导致全局上下文信息的丢失，从而在编码和解码阶段之间产生语义差距。为克服这些限制，本文提出了一种新型模型，该模型结合了双分支注意力多层编码器和渐进式融合金字塔池化网络。双分支注意力多层编码器通过并行提取路径有效捕获输入肺部感染图像的上下文信息。其中一个路径包含了一个改进的并行空间和通道挤压及通道激励（PscSE）模块，旨在重新校准通道注意力。在编码器和解码器的连接处，设计了一个渐进式融合金字塔池化模块，该模块采用多尺度池化和连续上采样，能够整合多尺度的语义信息，增强模型捕捉全局上下文线索的能力。因此，可以更精确地勾勒出肺部病变的边界，并更好地保留感染区域的多尺度语义细节，同时模型参数的额外增加量最小。实验结果表明，所提出的方法在两个公共数据集上的Dice相似系数（DSC）分别为0.8459和0.7758，优于其他对比模型。因此，该方法在检测、标记和其他病变区域的分割中具有潜在应用价值。

引言

一种新型冠状病毒的出现引发了全球大流行，其特征是广泛的肺部感染。这些感染导致了多种肺部病理变化，常常对肺部和呼吸系统造成严重损害。2019冠状病毒病（COVID-19）通过打喷嚏、呼吸道飞沫等多种途径高度传播[1]、[2]、[3]。根据世界卫生组织（WHO）的数据，全球确诊病例已超过7.5亿例，约有680万人因此死亡。在临床实践中，胸部计算机断层扫描（CT）仍是大多数肺部病变的主要诊断和分析手段。

准确分割COVID-19肺部感染区域有助于临床医生快速了解患者的感染程度，从而制定适当的治疗计划。人工智能技术的快速发展推动了医学图像分割任务的深度学习进展。然而，监督学习技术需要大量由医生标注的感染区域数据集，而COVID-19患者的肺部感染具有实性病变、磨玻璃样混浊（GGOs）、网状病变等多种复杂类型[4]、[5]、[6]。COVID-19感染病变的大小和位置在个体病例中差异显著，使得自动分割COVID-19肺炎感染区域更加困难[7]。在我们之前的研究[8]、[9]中，设计了几种医学图像分割算法并取得了有效结果。最近，我们发现这些方法在分割精度和适用性方面存在局限性，而深度学习在医学图像分割中的表现优于传统方法。例如，U-Net模型的独特架构被广泛用于医学分割等功能[10]、[11]。在这项工作中，提出了一种双分支注意力多层编码器和渐进式融合金字塔池化网络（DP-UNet），该网络结合了渐进式融合池化来扩展感受野，并且双分支注意力编码器在编码阶段充分提取上下文语义信息。特别是，所提出的DP-UNet经过训练后用于COVID-19病变区域的分割。本工作的主要贡献如下：(1)

针对输入图像中语义信息利用不足和细粒度信息提取不充分的问题，设计了双分支注意力多层编码器。双分支注意力编码器模块增加了编码阶段的卷积层数量，并将改进的并行空间和通道挤压及通道激励（PscSE）模块集成到分支结构中。PscSE模块在scSE模块之上引入了级联结构。在对输入信息进行通道挤压后，使用reduce max操作替换了原始的卷积操作以继续空间挤压，有效解决了scSE中缺乏通道信息交互机制的问题，从而使编码阶段能够从输入数据中提取更复杂的抽象特征。

(2)

设计了一个渐进式融合金字塔池化模块来扩展模型的全局感受野，并收集对特征提取至关重要的全局信息。该模块集成在编码器和解码器的连接处，通过在不同尺度上应用最大池化和全局平均池化操作逐步提取语义信息。在输出信息融合时，采用渐进式连接操作来增强全局上下文信息的利用，并减少上采样操作的次数。实验验证表明，渐进式融合金字塔池化模块有效缓解了最大池化和上采样操作导致的图像信息丢失，同时扩展了感受野，并增强了全局上下文信息的利用。

(3)

与现有方法相比，所提出的DP-UNet在公共数据集上的评估指标和分割性能表现出色。该模型的代码可在以下链接获取：https://github.com/Alphaandsigma/DP-UNet

提出的模型架构

本节将介绍所提出的DP-UNet模型的整体架构，以及双分支注意力多层编码器（DAM）、并行空间和通道挤压及通道激励模块（PscSE）、渐进式融合金字塔池化模块（PFP）的结构和详细信息。U-Net具有对称的编码器和解码器架构以及跳跃连接，有助于低级特征信息从编码器直接传输到

数据集

实验是在公开的COVID-19 CT肺部和感染分割数据集（LISD）（https://doi.org/10.5281/zenodo.3757476）上进行的，该数据集包含20名COVID-19患者的3520张CT切片。COVID-19感染区域由两名放射科医生标注，并由一名经验丰富的放射科医生进行了验证[36]。在预处理阶段，所有切片都被裁剪到肺部轮廓区域并调整大小为128 × 128像素。具体操作包括标准化

结论与讨论

计算机辅助分割COVID-19感染是早期检测和诊断肺部病变的有效方法。在本研究中，提出并开发了一种专门用于COVID-19感染区域分割的自动分割方法。所提出的方法采用U-Net骨干架构，并通过整合DAM模块来增强从输入图像中提取语义信息的能力。此外，PFP模块

CRediT作者贡献声明

王文峰：撰写 – 原始草案、可视化、验证、软件、方法论、调查、形式分析、数据整理。毛琪：撰写 – 审稿与编辑、监督、资源协调、项目管理、调查、资金获取、形式分析、概念化。田毅：撰写 – 审稿与编辑。王金涛：监督、调查。向振武：监督、调查。张艳：监督、调查。