模式识别是许多机器学习任务的基础,但仍然容易受到对抗性扰动的影响,这些扰动会利用模型结构来操纵特征并破坏语义一致性[1]、[2]。最近,扩散模型在模拟复杂数据分布以及生成高质量输出方面展现了显著的能力,应用于合成、编辑和跨模态翻译等任务[3]、[4]、[5]、[6]。基于这些进展,扩散净化器(DPs)[7]、[8]被引入作为预处理模块,用于从对抗性扰动的输入中恢复干净且具有区分性的特征。图1展示了一个面部识别系统中对抗性攻击和基于DPs的防御机制的示例。
与对抗性训练[9]、[10]或传统防御方法[11]、[12]相比,DPs提供了对抗攻击的鲁棒性和跨模型泛化能力。然而,当前的DPs面临一些限制,这些限制阻碍了其实际应用。首先,对抗性扰动会在净化过程中系统性地破坏语义一致性;其次,现有的DPs对所有频率谱的处理方式缺乏针对性[13]、[14],未能有效利用对抗性扰动的结构化频率特征。这些限制表明,保持语义一致性和采用频率感知策略对于实现强大的防御性能至关重要。
为了解决这些问题,我们提出了多视图小波引导扩散净化器(MWDP),这是一个即插即用的框架,无需对目标模型进行任何修改即可增强对抗鲁棒性。MWDP结合了多视图特征融合来提升语义一致性,并通过频率感知的软掩码学习来捕捉结构化的频率扰动。在多种面部识别模型上的广泛实验表明,即使在强适应性攻击下,MWDP也能持续超越现有先进基线算法,展现出卓越的跨模型泛化能力和实际应用价值。
我们的主要贡献如下:
- •
多视图特征融合以实现语义一致性。
我们设计了一个轻量级的预训练适配器,融合来自RGB、深度和近红外(NIR)图像的多视图特征,通过互补的结构先验来保持语义一致性,从而在对抗性扰动下提升鲁棒性。