AttackCC-CDM:通过操纵人群分布进行隐蔽的后门攻击,以干扰人群计数

时间:2026年3月16日
来源:Pattern Recognition

编辑推荐:

人群计数模型存在后门攻击漏洞,本文提出AttackCC-CDM框架,通过高密度风格纹理注入触发恶意逻辑,结合空间分布操纵策略,有效篡改模型计数且隐蔽性强,在多个基准数据集上验证优于现有方法。

广告
   X   

何立|顾米米|王旭轩|孔伟航|张世辉
燕山大学人工智能学院(软件学院),秦皇岛,066004,中国

摘要

人群计数是计算机视觉中的一个关键回归任务,广泛应用于公共监控、交通流量管理和大规模事件监测等安全敏感场景。随着深度学习的快速发展,人群计数模型在密集场景中取得了先进的性能,但它们仍然容易受到后门攻击。现有研究主要依赖于加性触发器结合标签操纵,这些方法隐蔽性有限,并忽略了空间分布在密度估计中的关键作用。在这项工作中,我们提出了一种针对人群计数任务的新型后门攻击框架,称为AttackCC-CDM,它结合了风格-纹理注入触发器和人群分布操纵(CDM)策略。该触发器通过高密度纹理注入嵌入到图像中,实现了视觉一致性和隐蔽的扰动。CDM策略在严格保持总计数的同时,扭曲了头部注释的空间分布。通过利用模型对局部密度模式的敏感性,实现了有效的分布操纵。在多个基准数据集(SHA、SHB、UCF-QNRF、JHU)和不同的人群计数模型上的广泛实验表明,AttackCC-CDM在低中毒率下能够有效攻击,其有效性和隐蔽性均优于现有方法。

引言

人群计数旨在通过密度回归学习来推断图像中的人数,这是模式识别领域中的一个核心但具有挑战性的任务。它在与安全相关的场景中找到了不可或缺的应用,例如公共安全监控和交通控制[1]。随着深度学习技术在人群计数领域的快速部署,基于深度神经网络(DNN)的回归方法已成为主流[2]、[3]。然而,尽管基于DNN的方法显著推动了人群计数的发展,但它们固有的数据驱动性质使它们面临显著的安全漏洞。
在潜在威胁中,后门攻击尤其危险。与依赖于推理时扰动的对抗性攻击不同,后门攻击在训练期间注入恶意逻辑,导致模型仅在特定触发器存在时输出目标预测。虽然后门机制在图像分类[4]、[5]中得到了广泛研究,但在人群计数这一典型的密集回归任务中的研究仍处于起步阶段。Sun等人的开创性工作[6](DMBA)通过叠加大规模模式(例如雨或光)作为触发器,并操纵真实密度图,将后门攻击应用于这一领域。然而,这种适应存在两个关键限制。首先,关于隐蔽性,DMBA通常依赖于加性的、基于天气的模式。虽然有效激活了后门,但这些加性叠加引入了可感知的视觉伪影,可能会损害攻击对抗视觉检查或异常检测的隐蔽性。其次,关于攻击机制,当前方法侧重于通过添加或删除注释点来改变总体计数,而忽略了操纵细粒度空间分布的潜力,而这在密集预测任务中是一个关键维度。
为了进一步扩展后门攻击的范围并探索人群计数中的更深层次漏洞,我们从卷积神经网络(CNN)的固有归纳偏见中获得了灵感。研究[7]、[8]揭示了DNN对图像风格和局部纹理之间的统计相关性高度敏感。例如,具有重复密集纹理的背景区域(例如碎石或植被)经常被误认为是高密度人群,从而在密度图中触发虚假激活。这一观察表明,基于风格的纹理可以作为强大且天然的隐蔽触发器。此外,与分类不同,人群计数需要预测空间连续的密度分布。这种分布的合理性是模型推理的关键基础。因此,对回归模型的有效攻击不仅应改变总体计数,还应操纵空间分布几何结构,以利用模型对结构一致性的依赖性。
基于这些见解,我们提出了AttackCC-CDM,这是一种专为人群计数设计的新颖后门攻击框架。我们设计了一种风格-纹理触发器注入机制。通过将高密度纹理风格无缝融合到图像中,这种方法保持了视觉连贯性,同时与目标输出建立了强烈的关联。至关重要的是,为了超越简单的计数修改,我们引入了人群分布操纵(CDM)策略。该策略系统地扰动了人群的空间分布——转移焦点或制造人为拥堵。这种双管齐下的方法确保了攻击在视觉上不可察觉,并且在结构上对回归推理过程有害。如图1所示,在相同的标签修改策略下,风格-纹理触发器在四个关键方面优于基于天气的触发器:更好的隐蔽性、与被污染标签的更强关联、与干净图像的更清晰区分度以及更高的攻击有效性。
总之,本文的主要贡献如下:
  • 1.
    我们提出了一种专门用于人群计数的新型风格-纹理触发器机制。通过利用模型的纹理偏见,该设计利用了模型对空间密度特征的敏感性,同时确保了与真实世界场景的视觉一致性,实现了高隐蔽性。
  • 2.
    我们引入了一种人群分布操纵(CDM)策略,将攻击范式从全局计数回归转变为空间密度扭曲,揭示了密度估计模型中更深层次的结构漏洞。
  • 3.
    我们开发了一个统一的后门攻击框架(AttackCC-CDM),并在多个基准数据集上验证了其有效性。广泛实验表明,我们的方法规避了最先进的防御措施,包括神经元剪枝[9]、微调[10]、输入净化[11]和后门检测[12]。
  • 部分片段

    人群计数

    人群计数研究已经从早期的基于检测的启发式方法发展到现代的深度学习范式。早期的基于检测的方法主要依赖于滑动窗口检测器通过对象定位来估计人数。例如,Viola等人[13]使用类似Haar的特征进行快速对象检测,而Dollar等人[14]通过集成快速特征金字塔进一步改进了这种方法。尽管在稀疏场景中有效,但这些方法在高密度场景中常常表现不佳

    方法

    在本节中,我们首先介绍威胁模型并阐述了人群计数模型的后门攻击问题。随后,我们描述了所提出的后门攻击(AttackCC-CDM)及其两个关键组成部分。

    数据集和网络

    实验在四个基准数据集上进行:上海理工Part_A(SHA)[42]、上海理工Part_B(SHB)[42]、UCF-QNRF [43]和JHU++ [44]。我们对四种人群计数模型进行了攻击,包括MAN [19]、Chf [17]、SSN [41]和Gram [20]。所有被后门攻击的模型都按照各自论文的原始训练协议进行训练,以确保公平性和可重复性。对于所有模型,采用Adam优化器,学习率为1×105

    对高级防御的抵抗力和分析

    为了评估AttackCC-CDM的鲁棒性,我们评估了四种防御方法(两种后门防御方法、一种输入净化方法和一种后门欺骗方法)的有效性,这些方法最初是为分类模型开发的:1)对模型修复的抵抗;2)对输入净化的抵抗;3)对后门检测的抵抗。我们确定了关键因素,并讨论了对设计未来针对回归的特定防御措施的启示。实验是在Chf模型上进行的

    结论

    在本文中,我们提出了AttackCC-CDM,这是一种用于人群计数的后门攻击框架,它结合了风格-纹理触发器注入机制和人群分布操纵策略。与主要依赖于传统基于天气的触发器并专注于操纵全局人群计数的现有后门方法不同,我们的框架明确强调了触发器的隐蔽性和空间人群分布的结构偏见,从而进一步扩展了攻击空间

    CRediT作者贡献声明

    何立:撰写 – 审稿与编辑,撰写 – 原始草稿,方法论,调查,资金获取。顾米米:撰写 – 原始草稿,方法论,调查。王旭轩:撰写 – 原始草稿,软件,资源。孔伟航:撰写 – 审稿与编辑,可视化,资金获取,数据整理。张世辉:撰写 – 审稿与编辑,监督,调查,资金获取。

    利益冲突声明

    作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

    致谢

    本文部分得到了中国国家自然科学基金(编号62306264、62476235、62173290)、中国政府指导的地方科技发展资金(编号236Z0303G)、河北省自然科学基金(编号F2024203091、F2023203012、F2025203045)、燕山大学(编号2025LGGH003)、中国留学基金委项目(编号202408130105)和河北省创新能力提升计划项目的支持。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有