相关研究
深度生成模型可能被恶意用于创建逼真的伪造面部图像和视频,这会损害公众的信任[16]。因此,开发强大且通用化的面部伪造检测器已成为一个紧迫且关键的挑战[17]。在本节中,我们简要介绍了现有的相关工作。
方法论
本节将描述所提出的SFD-ViT。首先将介绍整体架构,然后在第3.2至3.5节详细介绍模型。
实验
实验内容将在本节中展示。第4.1节和第4.2节分别介绍数据集和实验设置;第4.3节至第4.9节将展示实验结果。
消融研究
在本节中,我们设计了消融实验来验证所提出架构中每个模块的有效性。消融实验的设置在第5.1节中描述,结果在第5.2节中展示。
总结
精确度和召回率:我们认识到,在某些数据集上,其他模型可能会获得略高的精确度或召回率。一方面,这些模型可能在特定的面部伪造方法上表现出更高的专化性。相比之下,我们的方法旨在学习更通用和基础的伪造特征,可能在单个数据集或指标上不是最好的,但能在各个方面保持一致的高性能。另一方面,F1分数提供了更平衡的评估标准
结论
面部伪造检测技术的安全性和可靠性直接关系到个人隐私和社会信任。因此,迫切需要开发检测技术来应对由先进生成模型产生的面部伪造。为了解决这一挑战,本文提出了空间-频率双流视觉变换器(SFD-ViT)检测方法。SFD-ViT同时利用原始RGB图像及其频率域图像(通过离散余弦变换获得)
CRediT作者贡献声明
杨一康:撰写 – 审稿与编辑,撰写 – 原始草稿,可视化,验证,资源获取,调查,资金筹集,形式分析。邓玉琳:撰写 – 原始草稿,软件开发,方法论,数据管理。易秋旭:软件开发,方法论,数据管理。易俊:撰写 – 审稿与编辑,监督,项目管理,概念构思。
利益冲突声明
作者声明他们没有已知的财务利益冲突或个人关系可能影响本文所述的工作。
致谢
本工作得到了中国自然科学基金(项目编号CSTB2023NSCQ-MSX0796)、中国重庆市教育委员会科技研究计划青年项目(项目编号KJQN202401544和KJQN202501525)、重庆科学技术大学研究基金(项目编号ckrc202212055)以及重庆师范大学研究基金(项目编号25XLB016)的支持。