3D-DCASphereNet:一种具有球形表示的3D动态卷积注意力网络,用于高异质性的肺结节检测

时间:2026年2月2日
来源:Expert Systems with Applications

编辑推荐:

自动和准确检测三维CT扫描中的肺结节对早期肺癌诊断至关重要。传统锚点依赖的CNN方法存在形态多样性适应困难、模糊边界检测灵敏度低、人工设定锚点参数依赖性强等问题。本文提出的3D-DCASphereNet采用无锚点一阶段检测框架,通过注意力驱动的动态残差模块(ADRM)增强特征提取能力,结合基于几何约束的球体表示法(中心坐标+半径)优化空间定位精度,并引入KD-Tree加速中心匹配。实验表明,在LUNA16数据集上,该模型平均敏感度达89.51%,显著优于现有方法,同时减少人工参数设计依赖。

广告
   X   

Jingjing Yu|Hanchao Wang|Yiling Wen|Shihao Chen|Yuetong An|Xiaheng Lu|Xuelei He
陕西师范大学物理与信息技术学院,中国陕西省西安市710119

摘要

在3D CT扫描中自动且准确地检测肺结节对于肺癌的早期诊断至关重要。尽管传统的基于锚点的卷积神经网络(CNN)表现良好,但它们存在几个固有的局限性:(1)难以适应结节在形态、结构和密度上的多样性变化;(2)对边界不清晰或组织异质性较高的结节敏感度降低;(3)依赖于手动预定义的锚点参数,如大小和长宽比。为了解决这些问题,本文提出了一种无锚点框架3D-DCASphereNet,该框架结合了基于注意力的3D动态残差模块和具有几何约束的球体表示方法,以提高检测准确性和鲁棒性。网络架构采用基于注意力的3D动态残差模块与空间坐标图相结合,能够自适应地捕捉肺结节的各种特征和空间位置信息,特别是对于定义不清的结节和异质性组织。为了克服边界框对不规则结节的形态偏差,提出了一种基于几何驱动的球体表示的损失函数LS_VDIoU,用于评估球体的重叠区域,并优化对象的几何形状和空间位置差异。最后,采用基于KD-Tree的中心点匹配策略来增强无锚点检测能力,同时提高搜索和匹配效率。在LUNA16数据集上的实验表明,3D-DCASphereNet在每次扫描7个假阳性的条件下,平均敏感性达到了89.51%,优于现有的最先进方法。

引言

肺癌是全球主要的威胁生命的癌症之一,早期诊断对于实现最佳预后至关重要(Siegel, Miller, & Jemal (2015))。在计算机辅助诊断中,从CT医学图像中自动检测肺结节已成为肺癌筛查的研究热点。卷积神经网络(CNN)在目标检测方面的突破推动了基于CNN的肺结节检测算法的发展(Ding, Li, Hu, & Wang (2017); Dou et al. (2017); Mei, Cheng, Xu, Wan, & Zhang (2021); Tang, Zhang, & Xie (2019); Wang, Zhang, Zhang, & Wang (2020); Zheng et al. (2019); Zhu, Liu, Fan, & Xie (2018))。
目前的基于锚点的2D CNN检测主要分为两类:两阶段方法(例如Faster R-CNN及其变体),使用区域提议网络(RPN)进行区域提议,然后进行分类和回归(Ding et al. (2017); Dou et al. (2017); Ren, He, Girshick, & Sun (2016);以及一类阶段方法(例如SSD、YOLO),这些方法在速度和准确性之间取得平衡(Liu et al. (2016); Redmon & Farhadi (2017)。深度学习的最新进展在医学图像分析中表现出色(Jin et al. (2021); Wang et al. (2021b); Yang, Hou, & Ren (2022),并且越来越多的基于深度学习的方法被应用于肺结节检测(Marques et al. (2021); Rey, Arcay, & Castro (2021); Wang et al. (2021b))。然而,尽管基于锚点的方法在2D自然图像检测中表现出有效性,但在3D医学应用中存在关键局限性。这些问题包括:由于密集的锚点采样导致的计算效率低下(例如2D RetinaNet使用了超过100K个锚点(Lin et al. (2017a)),在体积数据中内存成本呈指数级增长,超参数依赖性(数量、大小、长宽比)需要手动设计,以及难以适应尺寸变化极大的肺结节,这特别影响了小结节的检测(Ding et al. (2017); Zlocha, Dou, & Glocker (2019))。
为了解决这些挑战,最近的研究引入了优化的架构和新的融合策略。例如,Zamanidoost等人提出了一种基于Faster R-CNN的优化多尺度CNN(OMS-CNN),结合了元启发式优化来增强特征提取和减少假阳性,从而实现对不同大小结节的高敏感性(Zamanidoost, Ould-Bachir, & Martel (2025)。Jian等人开发了一种通道混洗切片感知网络(CSSANet),利用切片间的注意力和通道混洗机制来更好地捕捉连续CT切片中的上下文信息,从而提高对细微结节的检测准确性(Jian et al. (2025)。此外,Zhou等人提出了LN-DETR,这是一种基于变压器的检测器,通过跨尺度特征融合和上下文重加权模块进行了增强,保持了检测性能的同时降低了计算开销(Zhou, Xu, Liu, & Liu (2025)。这些方法反映了人们为克服基于锚点框架的局限性并提高肺结节检测鲁棒性而持续的努力。
无锚点的一阶段检测方法在自然图像检测中也获得了关注(Duan et al. (2019); Tian, Shen, Chen, & He (2019); Wang et al. (2021a); Zhou et al. (2019a),通过关键点(中心/角点/极端点)和偏移向量来表示对象(Duan et al. (2019); Law & Deng (2018); Zhou, Zhuo, & Krahenbuhl (2019b)。然而,这些方法在3D医学图像中存在定位瓶颈,例如参考点落在目标区域外的中心错位、对不规则形态的几何不灵活性以及有限的体积适应性。值得注意的是,虽然临床肺结节诊断主要使用球体表示(中心坐标+半径)(MacMahon et al. (2017); Setio et al. (2017)),但大多数框架仍然使用边界框注释(Everingham & Eslami (2012); Lin et al. (2014)。
为了克服当前3D结节检测的局限性——特别是对形态异质性和与临床表示的几何不匹配的适应不足——我们提出了3D-DCASphereNet,这是一种无锚点的一阶段框架。本文的主要贡献如下:
  • 无锚点的一阶段检测设计:提出了一种无锚点的一阶段肺结节检测框架,结合了树状空间点搜索策略。这种方法消除了与锚点参数设计相关的计算冗余,同时提高了中心检测的敏感性。
  • 基于注意力的动态残差模块(ADRM):动态残差模块利用卷积核的加权聚合来自适应地提取多样化的结节特征。基于特征统计特性的注意力机制通过计算特征与其均值之间的通道偏差来标准化特征方差。这种架构显著提高了对定义不清的结节和异质组织的区分能力,有效减少了结节假阴性。
  • 几何驱动的球体表示:
    提出了一种球体参数化模型(“中心坐标+半径”),并配有一种基于球体交集-并集体积的损失函数(LS_VDIoU)。这种几何驱动的表示能够精确评估球体的重叠情况,并优化几何形状/空间位置差异。该方法克服了不规则结节的边界框形态偏差,同时显著提高了3D检测的准确性,并具有临床可解释性。
  • 本文的其余部分安排如下。第2节回顾了肺结节检测的先前工作及其面临的挑战。第3节详细介绍了3D-DCASphereNet框架,包括其架构和方法论。第4节详细介绍了本研究中设计的球体表示损失函数LS_VDIoU以及改进的训练策略。第5节介绍了数据集、评估指标和实验设置,对模型模块和损失函数进行了消融研究,并将提出的3D-DCASphereNet与LUNA16数据集上的现有最先进方法进行了比较。最后,第6节讨论了3D-DCASphereNet的优势和局限性,并总结了其在医学图像诊断和临床决策中的贡献。

    部分摘录

    无锚点对象检测模型

    肺结节检测在临床上是早期肺癌干预的关键,推动了广泛的计算机辅助诊断(CAD)研究。传统的CAD系统使用两阶段基于锚点的检测器(例如Faster R-CNN的3D扩展/FPN(Lin, Goyal, Girshick, He, & Dollár (2017b); Ren et al. (2016))以及单独的假阳性减少方法(Ding et al. (2017); Dou et al. (2017))。此外,焦点损失(Lin et al. (2017a)被用于训练基于锚点的检测器(Wang et al. (2020)以减轻

    方法论

    如图1所示,所提出的3D-DCASphereNet采用U形编码器-解码器架构,逐步提取和细化结节特征。该流程包括Pre BlockADRM核心块和上采样。Pre Block执行初始特征处理。ADRM核心块作为特征提取模块,实现了与多级空间坐标图结合的动态残差结构,以增强空间感知。SimAM-3D注意力机制进一步

    球体表示

    当前基于锚点的3D肺结节检测方法面临两个主要挑战。首先,对锚点超参数(例如大小、长宽比)的高敏感性,阻碍了对结节多样性的适应。其次,正样本和负样本之间的严重不平衡可能导致模型训练不稳定和检测性能不佳。鉴于肺结节通常是椭圆形的,使用球体表示可以提供更准确的表示,并且在旋转上保持一致性

    数据集和评估指标

    在这项研究中,所提出的框架在大型公共挑战数据集LUNA16(Setio et al. (2017))上进行了验证。该数据集包含888张低剂量CT扫描图像,其中标注了肺结节的质心和直径。对于LUNA16实验,数据集被分为训练子集(90%)和测试子集(10%),并对子集中的所有样本(1,186张)进行了数据增强操作(例如旋转、缩放、翻转),从而增加了总数

    讨论与结论

    在这项研究中,提出了一种无锚点的一阶段检测框架,结合了树状空间点搜索策略,以减少计算冗余并提高肺结节检测中心检测的敏感性。基于注意力的动态残差模块通过动态卷积、多级空间坐标图和SimAM-3D注意力机制,增强了了对不清晰结节和不同大小结节的感知能力。为了克服

    CRediT作者贡献声明

    Jingjing Yu:监督、写作——审阅与编辑、项目管理。Hanchao Wang:概念化、方法论、软件、验证、形式分析、调查、数据管理、写作——原始草稿。Yiling Wen:数据管理、写作——原始草稿。Shihao Chen:数据管理。Yuetong An:数据管理。Xiaheng Lu:数据管理。Xuelei He:概念化、监督、数据管理、写作——审阅与编辑、项目管理、概念化、资金支持

    利益冲突声明

    作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有