一种新型冠状病毒的出现引发了全球大流行,其特征是广泛的肺部感染。这些感染导致了多种肺部病理变化,常常对肺部和呼吸系统造成严重损害。2019冠状病毒病(COVID-19)通过打喷嚏、呼吸道飞沫等多种途径高度传播[1]、[2]、[3]。根据世界卫生组织(WHO)的数据,全球确诊病例已超过7.5亿例,约有680万人因此死亡。在临床实践中,胸部计算机断层扫描(CT)仍是大多数肺部病变的主要诊断和分析手段。
准确分割COVID-19肺部感染区域有助于临床医生快速了解患者的感染程度,从而制定适当的治疗计划。人工智能技术的快速发展推动了医学图像分割任务的深度学习进展。然而,监督学习技术需要大量由医生标注的感染区域数据集,而COVID-19患者的肺部感染具有实性病变、磨玻璃样混浊(GGOs)、网状病变等多种复杂类型[4]、[5]、[6]。COVID-19感染病变的大小和位置在个体病例中差异显著,使得自动分割COVID-19肺炎感染区域更加困难[7]。在我们之前的研究[8]、[9]中,设计了几种医学图像分割算法并取得了有效结果。最近,我们发现这些方法在分割精度和适用性方面存在局限性,而深度学习在医学图像分割中的表现优于传统方法。例如,U-Net模型的独特架构被广泛用于医学分割等功能[10]、[11]。在这项工作中,提出了一种双分支注意力多层编码器和渐进式融合金字塔池化网络(DP-UNet),该网络结合了渐进式融合池化来扩展感受野,并且双分支注意力编码器在编码阶段充分提取上下文语义信息。特别是,所提出的DP-UNet经过训练后用于COVID-19病变区域的分割。本工作的主要贡献如下:
(1)针对输入图像中语义信息利用不足和细粒度信息提取不充分的问题,设计了双分支注意力多层编码器。双分支注意力编码器模块增加了编码阶段的卷积层数量,并将改进的并行空间和通道挤压及通道激励(PscSE)模块集成到分支结构中。PscSE模块在scSE模块之上引入了级联结构。在对输入信息进行通道挤压后,使用reduce max操作替换了原始的卷积操作以继续空间挤压,有效解决了scSE中缺乏通道信息交互机制的问题,从而使编码阶段能够从输入数据中提取更复杂的抽象特征。
(2)设计了一个渐进式融合金字塔池化模块来扩展模型的全局感受野,并收集对特征提取至关重要的全局信息。该模块集成在编码器和解码器的连接处,通过在不同尺度上应用最大池化和全局平均池化操作逐步提取语义信息。在输出信息融合时,采用渐进式连接操作来增强全局上下文信息的利用,并减少上采样操作的次数。实验验证表明,渐进式融合金字塔池化模块有效缓解了最大池化和上采样操作导致的图像信息丢失,同时扩展了感受野,并增强了全局上下文信息的利用。
(3)