一个轻量级的修剪框架,通过泰勒展开和多知识保留策略实现最小程度的重新训练

时间:2026年2月3日
来源:Engineering Applications of Artificial Intelligence

编辑推荐:

人工智能在资源受限环境中的高效部署需求迫切,本文提出结构化剪枝框架,通过梯度感知的重要性评估与分层多知识协同重建,解决传统剪枝方法在线性区域和非线性激活域中的评估偏差及重构效率问题。实验表明该方法在CIFAR10和ImageNet数据集上实现4倍加速,保持SOTA压缩率与精度。

广告
   X   

Suyun Lian|杨赵|贾建才|廖木欣|Stefan Poslad|裴志宏
深圳大学,智能信息处理广东省重点实验室,电子与信息工程学院,中国深圳,518060

摘要

在资源受限的环境中,人工智能(AI)变得越来越重要,高效的模型设计直接影响实际应用。本文实现了一种结构化剪枝框架作为AI技术,旨在使深度卷积神经网络(CNN)能够应用于实际任务中。CNN在需要空间精度的应用中仍然处于基础地位,例如医学成像和自动驾驶。然而,它们巨大的计算需求(例如16层的视觉几何组网络(VGG)需要155亿次浮点运算(FLOPs))与边缘设备的严格资源限制相冲突。为了克服现有剪枝方法的局限性,我们提出了一种结构化剪枝方法,该方法结合了基于梯度的重要性评估和分层错误重建。该框架包括两个核心创新:(1)混合阶重要性准则,通过融合一阶和二阶泰勒展开来量化通道冗余;(2)多知识协同重建,用分层多尺度特征重建替代传统的“剪枝-重新训练”范式,以保持表示能力。在多种架构和不同规模的数据集上的广泛实验表明,我们的方法在保持竞争力准确性的同时实现了最先进的模型压缩(SOTA),优于现有的结构化剪枝算法。此外,剪枝后的模型在推理速度上提高了四倍,验证了其实际效果。

引言

人工智能(AI)的迅速发展极大地改变了计算机视觉领域,这在很大程度上得益于深度学习架构的创新(Sharifani和Amini,2023年;Voulodimos等人,2018年)。卷积神经网络(CNN)仍然是包括农业、医学图像分析和自动驾驶在内的关键视觉任务的基石(Litjens等人,2017年;He等人,2023年;Han等人,2022年;Sangaiah等人,2025年)。然而,深度CNN的计算需求给部署带来了巨大挑战。例如,16层的视觉几何组网络(VGG)在前向传播中需要155亿次浮点运算(FLOPs)(Simonyan和Zisserman,2014年),而更深层次的架构如152层的残差网络(ResNet)则需要113亿次运算(He等人,2016年)。这些高资源需求在边缘计算场景中尤为突出,因为智能相机、无人机和移动平台等设备必须在内存、功耗和实时处理方面受到严格限制(Gowda等人,2025年;Jiang等人,2023年)。模型复杂性与硬件限制之间的这种日益增长的不匹配凸显了需要有效的模型压缩技术,以在保持准确性的同时提高计算效率。
模型压缩已成为一个关键的研究领域,它整合了优化理论、硬件感知设计和机器学习的原理。已经探索了多种技术来平衡效率和性能。知识蒸馏通过逻辑对齐和特征匹配促进从大型教师模型到紧凑学生模型的知识转移(Hinton等人,2015年)。量化降低了数值精度,将高位表示映射到低位格式,极端情况下甚至可以使用1位精度的二进制网络(Jacob等人,2018年)。神经架构搜索(NAS)利用强化学习或基于梯度的优化自动发现优化的网络拓扑(Zoph和Le,2016年)。在这些策略中,结构化剪枝因其对CNN加速的实际优势而脱颖而出。与引入不规则稀疏模式的不结构化剪枝不同,结构化剪枝会移除整个滤波器或通道,从而保持网络的密集结构。这种规律性确保了与标准推理引擎的兼容性,并消除了与稀疏矩阵操作相关的开销,使得结构化剪枝成为实际应用中的高效方法(Lian等人,2025年;Cai等人,2025年)。
结构化剪枝的成功取决于两个关键因素:(1)识别对模型性能影响最小的冗余滤波器;(2)剪枝后有效恢复表示能力。然而,现有方法存在几个局限性。基于幅度、基于相似性和一阶的方法主要在线性假设下运行,因此难以捕捉由修正线性单元(ReLU)激活函数、批量归一化(BN)和残差耦合引起的复杂非线性激活模式。这种不匹配可能导致重要性排名不稳定和准确性下降,尤其是在剪枝通道仅在非线性区域起关键作用时。这暴露了一个需要考虑线性敏感性和非线性激活动态的标准的空白。因此,我们提出了一种新的非线性感知标准,明确考虑了线性和非线性两种情况,从而提高了冗余通道量化的精度,并做出了更稳定的剪枝决策。
此外,传统的“剪枝-重新训练”策略过度依赖计算密集型的重新训练阶段来恢复模型的表现能力。虽然分层错误重建提供了一种绕过重新训练的潜在替代方案,但现有方法主要依赖于过于简化的目标,如均方误差(MSE)最小化,这些目标无法有效保持对特征表示至关重要的多尺度空间层次结构。我们提出了一种多知识特征重建策略,恢复了剪枝层的容量。这在多个尺度上建立了层次化的特征保留,同时保持了低级纹理模式和高级语义信息。
总体而言,我们的主要贡献总结如下。
  • 我们提出了一种结构化剪枝框架,它将基于梯度的重要性评估与逐层错误恢复相结合,有效加速了深度学习模型的同时保持了它们的表示能力。
  • 我们提出了一种混合阶重要性准则(HOIC),通过结合一阶和二阶泰勒展开精确量化结构的重要性。它在平滑区域保持了一阶效率,同时通过二阶校正补偿了梯度的消失。
  • 我们提出了一种多知识协同重建(MKSR)方法,取代了传统的“剪枝-重新训练”范式。它建立了分层多尺度特征保留架构,克服了单一目标重建策略的局限性。

剪枝标准

神经网络参数对输出的影响各不相同:关键权重决定了分类准确性,而其他参数则引入了冗余或噪声。量化这些不同的贡献是剪枝研究的基础,使得能够精确识别和移除非必要组件。
在各种标准中,基于幅度的方法是一种直观的方法,其前提是绝对值较大的参数具有更大的重要性(

方法

所提出的框架明确了这项工作的核心目标:开发一种神经网络剪枝方法,在保持模型紧凑性的同时保留关键架构结构并最小化性能下降。为了实现这一双重目标,我们的算法围绕两个主要组成部分构建。首先我们在第3.2节介绍了一种细粒度的重要性度量方法,该方法结合了泰勒展开分析。

数据集和网络

所提出的方法在两个数据集上进行了验证:加拿大高级研究院数据集(CIFAR10)和ImageNet大规模视觉识别挑战数据集(ImageNet)。CIFAR10数据集包含50,000个训练样本和10,000个测试样本,分为10个类别。CIFAR10中的样本经过归一化,均值分别为[0.4914, 0.4822, 0.4465],标准差分别为[0.2023, 0.1994, 0.2010]。图像被调整到统一的32 × 32像素尺寸。

结论

在这项工作中,我们提出了一个计算效率高且精确的深度神经网络结构化剪枝框架,这是由于现有方法中的两个关键限制:(1)当前重要性指标在非凸优化场景下的不足,特别是在梯度消失的情况下;(2)剪枝后重新训练的计算开销过高。为了解决这两个挑战,我们提出了两个协同组件:HOIC结合了一阶

CRediT作者贡献声明

Suyun Lian:撰写——原始草稿、方法论、调查、形式分析、概念化。杨赵:撰写——审阅与编辑。贾建才:可视化、验证。廖木欣:撰写——审阅与编辑。Stefan Poslad:撰写——审阅与编辑。裴志宏:撰写——审阅与编辑、撰写——原始草稿。

数据的伦理和知情同意

由于数据已经公开可用且不涉及人类或动物受试者,因此本研究不需要伦理批准或知情同意。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。

致谢

这项工作部分得到了国家自然科学基金(项目编号62201355)、广东省基础与应用基础研究基金(2024A1515010977, 2025A1515060013)、深圳大学青年学者科学基金、广东省重点实验室(2023B1212060076, 2017B030314073)的支持。
Suyun Lian分别于2019年和2022年在中国赣南师范学院获得学士和硕士学位。她目前在中国深圳大学电子与信息工程学院攻读博士学位。她的研究兴趣包括深度学习、模式识别和图像处理。

生物通微信公众号
微信
新浪微博


生物通 版权所有