传统的医学图像自动检测方法已经显示出较高的准确性。随着机器学习技术的发展,深度学习作为医学辅助诊断的新方法得到了广泛应用(Bi等人,2017年;You等人,2025年;Hekler等人,2019年)。近年来,深度学习在医学图像分析领域取得了突破性进展。Sahu和Kashyap(2023年)提出了一种基于深度学习的有效自动检测方法,用于CT扫描图像的COVID-19自动多分类任务,其准确性比传统方法有显著提高。Ausawalaithong等人(2018年)将DenseNet网络应用于肺癌分类,并结合迁移学习方法来缓解小数据集的问题。与传统的机器学习方法不同,深度学习模型能够自主学习数据集的多层次抽象、表示和信息,无需人工干预。这一特性使它们成为病理学家克服主观视觉评估障碍的强大工具(Uhm等人,2021年;Shapira等人,2020年)。
可靠的分类模型可以帮助临床医生更快、更准确地解释医学图像。尽管卷积神经网络(CNN)在计算机辅助诊断方面取得了快速进展(Rawat和Wang,2017年;Masud等人,2022年),包括ResNet(Xu等人,2023年)和Inception(Soumik和Hossain,2020年)等代表性变体,但它们的感受野有限,因此在提取局部细节方面表现良好,但在捕捉长距离依赖关系方面效果较差,尤其是在病变形态在不同个体之间存在显著差异时(Khatri等人,2024年)。基于Transformer的架构(Peng等人,2021年)通过自注意力来建模全局上下文,并且具有尺寸灵活性;然而,纯自注意力缺乏明确的局部性先验,其捕捉精细结构的能力取决于补丁大小、架构选择和数据规模。此外,这类模型通常依赖于大型、注释良好的数据集,而这在医学成像中成本较高。因此,现有的流程往往未能充分利用跨尺度/层次结构的互补关系,也缺乏一种原则性的机制来选择性地强调临床上的显著线索,同时抑制冗余响应。
总之,深度学习依赖于神经元强大的自学习能力。经过成功训练后,它可以根据学到的映射进行智能预测。它已被广泛用于医学图像分类任务。然而,上述现有的深度学习模型在特征提取方面仍存在一些局限性:1)在多个尺度上的特征提取能力不足;2)不同特征之间的差异和相关性没有得到有效区分;3)对显著特征的关注不足,以及重复使用冗余信息。为了解决这些局限性,开发了一种新颖的交互式轴向特征选择模型,该模型可以有效改进视觉表示的性能,并具有强大的特征交互和噪声减少能力。该模型首先使用ResNet18作为骨干网络来实现多尺度局部空间特征提取,同时通过跨层信息流减少冗余信息的使用。其次,设计特征交互模块(FIM)用于建立不同尺度特征之间的关系,突出差异,并增强全局上下文语义的表达。最后,受关注显著信息的注意力机制的启发,新开发的轴向特征选择模块(AFSM)从水平、垂直和空间方向过滤交互特征信息,并实现逐层交叉聚合,以突出显著特征的表示并进一步减少无关噪声。本文的主要贡献如下:
•提出了一种新的特征交互模块(FIM),用于探索多样化特征之间的空间差异和相关性。通过建立依赖关系和互补性,它增强了局部空间特征和全局上下文细节的表示,有效解决了现有方法中特征交互不足的问题。
•开发了一种轴向特征选择模块(AFSM),用于从水平、垂直和空间维度建模和过滤多尺度空间-语义细节。利用阈值优化策略和分层交叉聚合机制,它强化了显著特征的表现,同时过滤掉无关噪声。这种方法建立了特征之间的有效连接,显著提高了模型解释复杂医学图像的能力。