2022-ECCV-Explaining Deepfake Detection by Analysing Image Matching

一、研究背景

1.大量工作将深度伪造检测作为一个二分类任务并取得了良好的性能。

2.理解模型如何在二分类标签的监督下学习伪造相关特征仍难是个艰巨的任务。

3.视觉概念:具有语义的人脸区域,如嘴、鼻子、眼睛。

二、研究目标

1.验证假设,并从图像匹配的角度评估视觉概念的关系,以此解释检测模型的预测结果。

2.解释深度伪造检测模型如何在二分类标签的监督下学习伪影特征。

3.习得更好的检测模型,提高在压缩视频上的伪造检测性能。

三、研究动机(3种假设)

1.检测模型将既不与原图相关也不与目标图相关的视觉概念看作是与伪造相关的视觉概念,性能良好的检测模型应该基于源/目标-无关的视觉概念来判断真伪。

2.在标签的监督下,伪造-原图-目标图匹配可以帮助丢弃伪造无关视觉特征,隐式学习伪造相关的视觉概念。

3.利用原始训练集进行图片匹配习得的视觉概念容易受到视频压缩的影响。

四、技术路线

假设1:

  1. 设计源编码器 v s v_s vs和目标编码器 v t v_t vt区分图片中的视觉概念。
  2. 令伪造图片与相应源/目标图片具有相同属性标签,以此训练编码器。
  3. 用Shapley value评估视觉概念的区域贡献。例如:
    对输入图片做 L × L L\times L L×L区域划分,得到 G = { g 11 , ... , g L L } G=\{g_{11},\dots,g_{LL}\} G={g11,...,gLL}。
    当 ϕ v d ( g i j ∣ G ) > 0 \phi_{v_{d}}(g_{ij}\mid G)>0 ϕvd(gij∣G)>0时,证明区域 g i j g_{ij} gij与伪造相关。
  4. 评估视觉概念间的关系:
    利用掩膜操作定位源/目标相关区域:
    M τ = I ( m a x ( ϕ v s , ϕ v s ) ) > τ M_{\tau}=I(max(\phi_{v{s}},\phi_{v{s}}))>\tau Mτ=I(max(ϕvs,ϕvs))>τ
    评估视觉概念间的交叉强度,第一项为无关区域的相关强度,第二项为相关区域的相关强度:

假设2:

设置两种训练集:

第一种:真实图片仅包含和伪造图片相关的原图/目标图

第二种:真实图片与伪造图片不相关

假设3:

评估稳定性:

对于压缩图片,由源/目标编码器习得的视觉概念更加稳定。

FST-Matching Deepfake Detection Model:

直接将源/目标无关特征从源/目标视觉概念中分离出来去进行真伪检测可以提升在压缩视频上的性能。

  1. 习得源特征 f s f_s fs和目标特征 f t f_t ft
  2. 利用通道注意力自动解纠缠源/目标无关特征 f s i r f_s^{ir} fsir、 f t i r f_t^{ir} ftir和源/目标相关特征 f s r f_s^{r} fsr、 f t r f_t^{r} ftr
  3. 设置 Fake-Source/Target Pair Verification module验证解纠缠的有效性,令源/目标图片的 f r f^{r} fr具有和原始图片相同的属性标签,并进行属性预测
  4. 增强 f s i r , f t i r f_s\^{ir}, f_t\^{ir} fsir,ftir的交互, h h h为预测模块,令联合预测损失小,单一预测损失大,0输入的影响小。
  5. 总损失

五、实验结果

六、思考

  1. 解纠缠:伪造无关特征包含身份属性,伪造相关特征联合区分真假
  2. 图匹配:在匹配中去除相同属性的干扰
  3. 输入:上下支路均有源、目标、伪造图片
相关推荐
用户5191495848459 分钟前
CVE-2025-0282 Ivanti 远程命令执行漏洞利用工具
人工智能·aigc
代码Plato11 分钟前
Tokenmaxxing的排行榜应该反着看
人工智能
云烟成雨TD11 分钟前
Spring AI 1.x 系列【59】容器化开发支持:Docker Compose 与 Testcontainers
人工智能·spring·docker
weixin_3077791312 分钟前
智能模拟数据生成平台:生成式AI合成数据技术重塑开发测试效能
人工智能·测试工具·算法·测试用例
掘金一周15 分钟前
走过路过有没有好心人help一下,我有两个问题需要大家帮忙集思广益下 | 沸点周刊 6.11
人工智能·ai编程·沸点
cui178756815 分钟前
物业费收缴困局的破题之路:2026年社区商业逻辑的底层重构
大数据·数据库·人工智能
北塔软件16 分钟前
北塔软件智能体平台 | 不只监控,更是AI时代的数据资产
运维·人工智能·知识库·北塔软件
早起CaiCai19 分钟前
【Pytorch 实践1】手写数字
人工智能·pytorch·python
monsion30 分钟前
Loop Engineering:你不再 prompt agent,而是设计 prompt agent 的系统
大数据·人工智能·prompt
卡梅德生物科技小能手33 分钟前
卡梅德生物科普MCAM(黑色素瘤细胞黏附分子)
人工智能·经验分享·深度学习