面部识别和认证系统在日常生活中应用广泛,例如解锁手机、验证移动支付和在线银行交易。然而,将面部识别技术应用于这些场景也会带来潜在的安全风险,因此需要特定的技术来确保应用安全。因此,开发了许多面部防欺骗(FAS)方法来对抗面部展示攻击,如打印攻击、重放攻击和3D攻击。特别是在[1]中,我们通过将可学习描述性卷积(LDC)集成到常规卷积网络中,提高了CNN捕捉与面部展示攻击相关的内在特征的能力。受到LDC[1]优异性能的启发,在[2]中,我们进一步将LDC特征集成到ViT框架中,开发了可学习描述性卷积视觉变换器(LDCformer),以模拟FAS的长距离和区分特征。
由于LDCformer[2]仅使用交叉熵损失进行训练,因此在FAS领域仍面临三个主要挑战。首先,如[1]所述,FAS涉及真实面部和伪造面部之间高度相似的特征,需要更精细的表示方法来准确捕捉与面部欺骗攻击相关的内在特征。因此,第一个挑战在于缺乏细粒度的真实标签,这对于学习细粒度的活性特征至关重要。大多数基准数据集仅提供二进制真实标签来指示图像是真实的还是伪造的,但没有提供关于伪造区域位置的区域信息。因此,许多现有方法依赖于辅助监督,如面部深度图[3]和反射图[4]来指导FAS模型学习细粒度特征,如图1所示。虽然这些辅助监督在特定场景下有效,但它们严重依赖于所采用信息的可用性和质量,并不适用于所有场景。例如,面部深度对于检测3D面具攻击无效,因为伪造面部和真实面部的面部深度特征相似[5]。同样,反射图[4]也有限,因为在户外场景中,伪造面部和真实面部反射的阳光行为相似[5]。FAS的第二个挑战是检测微妙的局部伪造攻击。尽管大多数现有FAS方法旨在检测全脸伪造攻击,但它们常常忽略了局部伪造攻击的可能性。如图2所示,PADISI-Face数据集中的“搞笑眼睛”和“纸眼镜”攻击针对特定面部区域,从而增加了准确检测这些类型攻击的难度。最后,FAS的第三个挑战是跨域问题。由于不同的基准数据集是独立收集的,并且具有不同的分布特征,因此在某个数据集(即训练域)上训练的模型通常无法检测到其他未见数据集(即未见域)中的攻击。
在本文中,我们旨在通过解决上述三个挑战来大幅增强LDCformer[2]在FAS领域的能力。我们提出了三种新的训练策略来联合监督LDCformer的训练,包括双注意力监督、自我挑战监督和过渡三元组挖掘。首先,为了解决缺乏细粒度监督的问题,如图1所示,我们提出了双注意力监督,通过引入两个额外的注意力估计器,并在辅助模型的指导下进行训练,以鼓励LDCformer关注区域性的真实/伪造注意力。值得注意的是,这两个注意力估计器和辅助模型都是与LDCformer一起联合训练的,无需依赖任何外部辅助信息。接下来,为了检测微妙的局部伪造攻击,我们提出了一种自我挑战监督策略,通过混合真实图像和伪造图像来生成具有挑战性的增强数据,以增强LDCformer在活性特征和局部伪造攻击之间的区分能力。此外,为了解决跨域问题,我们提出了一种过渡三元组挖掘策略,通过缩小跨域差距同时保持真实特征和伪造特征之间的过渡关系,来增强学习特征的领域泛化能力。这三种策略共同训练LDCformer,使其能够学习高度真实/伪造的区分特征和领域泛化特征。在FAS基准测试上的实验结果表明,在这三种训练策略的联合监督下,LDCformer在领域内和跨领域测试场景中的性能均达到了最先进水平。
我们的贡献总结如下:
• 我们提出了三种新的训练策略,共同监督我们之前提出的LDCformer[2]的训练,以大幅扩展其在模拟FAS长距离和高度区分特征方面的能力。
• 双注意力监督、自我挑战监督和过渡三元组挖掘策略被开发出来,以明确解决缺乏细粒度标签的问题,提高对微妙局部伪造攻击的检测能力,并解决跨域问题。
• 我们的消融研究和实验比较验证了这些策略在鼓励LDCformer学习高度区分性和领域泛化特征方面的有效性。