可变形图像配准是医学图像分析中的关键任务,具有广泛的应用[1]、[2]、[3]。传统的配准方法(如Demons [4]、B-spline [5]、SyN [6] 和 DARTEL [7])通常需要大量优化才能匹配相应的特征点,导致配准速度较慢。当前的深度学习方法可以自动学习特征表示并实现更快的配准速度。Voxelmorph [8] 是一种基于U-Net [9] 的创新配准方法,它利用CNN提取图像特征并通过空间变换网络(STN)[10] 生成变形场[10]。许多后续研究[11]、[12]、[13]、[14]、[15] 也采用U形卷积网络来提高配准精度。然而,由于卷积结构的限制,这些网络难以有效捕捉长距离依赖性。因此,各种Transformer模型[16]逐渐与CNN结合使用,如ViT-V-Net [17] 和 TransMorph [18],这些模型能更好地考虑局部和全局特征。
尽管取得了显著进展,但目前大多数研究主要集中在MRI和CT等成像模式上[12]、[13]、[14]、[18]、[19]。虽然这些模式具有高分辨率和清晰的解剖结构,但在心脏领域,超声心动图具有独特优势。作为一种无创且实时的成像技术,超声心动图能够直观地显示心脏的结构和功能,对于心血管疾病筛查、鉴别诊断和预后评估至关重要。然而,由于噪声、伪影以及心脏运动的影响,超声心动图图像配准仍然是一个更具挑战性的任务。
目前,超声心动图图像配准[20]、[21] 主要关注左心室,以研究同一患者的心脏运动模式和功能变化。在实际临床研究中,评估心肌厚度和运动幅度以及心脏疾病的群体特征统计分析也很重要,但现有的配准方法在这些方面仍存在不足[20]、[21]、[22]。需要配准方法能够处理更复杂的情况,包括解剖结构差异、不同患者之间的运动模式变化、运动中的薄壁结构、模糊的边缘和噪声图像。
为了抑制这些不利因素的影响,我们提出了一种新的残差感知自适应配准模型RANet,该模型采用端到端网络拓扑结构,基于移动和固定图像的残差特征指导自适应特征提取和融合。
Transformer和CNN通常结合使用以捕获局部和全局特征[18]、[23]、[24]。然而,在超声心动图的背景下,这些方法存在两个限制:首先,Transformer中的大量参数显著增加了计算成本;其次,低对比度、斑点噪声和运动伪影干扰了传统Transformer区分实际组织变形和噪声干扰的能力,可能引入冗余的全局相关性计算。这种干扰,而非复杂的解剖结构,是超声心动图的主要挑战。在我们设计的编码阶段,基于自适应小波卷积(WTConv)[25] 的并行增强编码器(PEE)和普通CNN被构建出来,以自适应地提取多尺度的全局和局部特征,同时保持参数数量较少。然后通过多头残差注意力(MRA)模块引导网络关注需要对准的特定区域,该模块利用移动和固定图像的深度残差特征。这对于心肌壁和左心房的配准特别有益。此外,在编解码器的跳过连接中引入了自适应协作注意力(ACA),使网络能够关注重要特征,过滤掉背景和噪声等无关信息,并在融合不同尺度的特征时自适应地学习最佳权重。
总结如下:
- •
在这种端到端的RANet架构中,PEE模块使用自适应WTConv和CNN并行提取多尺度的全局和局部特征。
- •
我们提出了MRA模块,利用残差特征引导网络针对不同结构边缘之间图像对的不匹配区域进行有针对性的配准。
- •
我们提出了ACA模块,它在跳过连接中整合了通道-空间-上下文渐进式注意力和可学习权重,从而动态平衡多尺度特征对配准的贡献,集中关注关键特征,并阻挡噪声干扰。