一种用于医学图像分类的交互式轴向特征选择网络

时间：2026年1月31日

来源：Neural Networks

编辑推荐：

医疗图像分类中，本文提出交互式轴向特征选择网络（IAFSNet），通过特征交互模块（FIM）增强多尺度特征互补性，轴向特征选择模块（AFSM）从水平、垂直和空间维度过滤噪声并强化关键特征。实验证明该模型在四个基准数据集上分类准确率显著提升，优于传统CNN和Transformer方法。

潘帅|胡春华|赵娟|于海芳

山东航空大学自动化与电气工程学院，滨州市，256600，山东，中国

摘要

为了解决特征之间的差异和相关性，并充分利用显著语义在医学图像分类任务中的重要性，本文提出了一种交互式轴向特征选择网络（IAFSNet），旨在改进特征表示，有效过滤分类过程中的噪声，从而提高分类性能。本文介绍了一种新设计的特征交互模块（FIM），该模块可以学习不同特征之间的空间差异，并增强局部空间特征与全局上下文语义之间的相互依赖性和互补性。此外，本文实现了一种新颖的轴向特征选择模块（AFSM），该模块从水平、垂直和空间三个角度过滤显著的特征语义。通过调整阈值，可以突出显著特征并消除无关噪声，使这些关键特征能够逐层交叉聚合并建立相互作用，最终提高分类准确性。在四个基准数据集上的实验结果表明，所提出的IAFSNet表现出优异的分类性能和鲁棒性，显著优于许多现有的分类方法。

引言

传统的医学图像自动检测方法已经显示出较高的准确性。随着机器学习技术的发展，深度学习作为医学辅助诊断的新方法得到了广泛应用（Bi等人，2017年；You等人，2025年；Hekler等人，2019年）。近年来，深度学习在医学图像分析领域取得了突破性进展。Sahu和Kashyap（2023年）提出了一种基于深度学习的有效自动检测方法，用于CT扫描图像的COVID-19自动多分类任务，其准确性比传统方法有显著提高。Ausawalaithong等人（2018年）将DenseNet网络应用于肺癌分类，并结合迁移学习方法来缓解小数据集的问题。与传统的机器学习方法不同，深度学习模型能够自主学习数据集的多层次抽象、表示和信息，无需人工干预。这一特性使它们成为病理学家克服主观视觉评估障碍的强大工具（Uhm等人，2021年；Shapira等人，2020年）。

可靠的分类模型可以帮助临床医生更快、更准确地解释医学图像。尽管卷积神经网络（CNN）在计算机辅助诊断方面取得了快速进展（Rawat和Wang，2017年；Masud等人，2022年），包括ResNet（Xu等人，2023年）和Inception（Soumik和Hossain，2020年）等代表性变体，但它们的感受野有限，因此在提取局部细节方面表现良好，但在捕捉长距离依赖关系方面效果较差，尤其是在病变形态在不同个体之间存在显著差异时（Khatri等人，2024年）。基于Transformer的架构（Peng等人，2021年）通过自注意力来建模全局上下文，并且具有尺寸灵活性；然而，纯自注意力缺乏明确的局部性先验，其捕捉精细结构的能力取决于补丁大小、架构选择和数据规模。此外，这类模型通常依赖于大型、注释良好的数据集，而这在医学成像中成本较高。因此，现有的流程往往未能充分利用跨尺度/层次结构的互补关系，也缺乏一种原则性的机制来选择性地强调临床上的显著线索，同时抑制冗余响应。

总之，深度学习依赖于神经元强大的自学习能力。经过成功训练后，它可以根据学到的映射进行智能预测。它已被广泛用于医学图像分类任务。然而，上述现有的深度学习模型在特征提取方面仍存在一些局限性：1）在多个尺度上的特征提取能力不足；2）不同特征之间的差异和相关性没有得到有效区分；3）对显著特征的关注不足，以及重复使用冗余信息。为了解决这些局限性，开发了一种新颖的交互式轴向特征选择模型，该模型可以有效改进视觉表示的性能，并具有强大的特征交互和噪声减少能力。该模型首先使用ResNet18作为骨干网络来实现多尺度局部空间特征提取，同时通过跨层信息流减少冗余信息的使用。其次，设计特征交互模块（FIM）用于建立不同尺度特征之间的关系，突出差异，并增强全局上下文语义的表达。最后，受关注显著信息的注意力机制的启发，新开发的轴向特征选择模块（AFSM）从水平、垂直和空间方向过滤交互特征信息，并实现逐层交叉聚合，以突出显著特征的表示并进一步减少无关噪声。本文的主要贡献如下：

•

提出了一种新的特征交互模块（FIM），用于探索多样化特征之间的空间差异和相关性。通过建立依赖关系和互补性，它增强了局部空间特征和全局上下文细节的表示，有效解决了现有方法中特征交互不足的问题。

•

开发了一种轴向特征选择模块（AFSM），用于从水平、垂直和空间维度建模和过滤多尺度空间-语义细节。利用阈值优化策略和分层交叉聚合机制，它强化了显著特征的表现，同时过滤掉无关噪声。这种方法建立了特征之间的有效连接，显著提高了模型解释复杂医学图像的能力。

本研究的其余组织结构如下：第2章详细介绍了与医学图像分类相关的工作。第3章重点介绍了所提出的交互式轴向特征选择框架（IAFSNet）及其相应的内部组成模块。第4章提供了详细的实验结果和分析。第5章给出了结论和未来研究计划。