机器学习周报三十二

文章目录

摘要

本周延续上周的工作,上周的工作是对场景文字编辑的研究,如果将生成的场景文字图片应用到深度伪造领域,提出有效的检测方式,会是一个不错的工作,于是,本周学习了两篇关于深度伪造检测领域的论文。

Abstract

This week continued the work from last week. Last week's work focused on researching textual scene editing. If the generated images of scene text are applied to the field of deepfake, proposing effective detection methods would be valuable work. Therefore, this week I studied two papers on deepfake detection.

1 伪造检测

过去的检测方法依赖于获取模型权重(开源模型)或者大量真实图像数据集(闭源模型),限制了检测方法的可拓展性和在现实场景的实际应用。

生成式模型在生成的图片损坏后进行修复的效率比真实图片损坏后进行修复更快。理论的依据开始是一个直觉,然后经过实验发现两种图像的分布确实不同。通过这一个见解,开发了一种检测流水线如图。

1.通过应用掩码损坏目标图像

2.使用生成模型修复损坏的内容

3.将修复之后的图片和未损坏的图片进行比较

理想情况下,修复生成的图片会更快,因为生成的图片更符合自己了解的分布。

因此,可以计算一个可测量的分数来区分真实的和伪造的图片。技术上,假设一个生成模型G_t可以内在的识别自己的输出,能够比其他图像更有效的重建自己生成图像的掩码区域。将问题抽象成二分类问题:被检测图像是不是由G_t生成(是=1,否=0)。

1.从只能从0开始生成的闭源扩散生成式模型收集数据集x,利用LoRA冻结主干,训练部分参数,得到低成本的对齐。

2.对输入图像s进行"腐蚀"得到s_1,s_1输入开源替代模型对腐蚀区域修复,得到修复结果y。

3.打分函数衡量腐蚀区域y_0和修复区域y的差异,差异越小的越可能是生成式图像。

打分函数:PSNR(y_0,y),PSNR作为代理指标,PSNR值越大代表像素误差越低,也就说明生成模型对自身图像修复质量更高。

2. D 3 D^3 D3

过去的检测方法仅对一个特定生成器进行训练,但是在多个生成器的生成图像进行测试,强调从单个生成器的泛化能力,这会导致训练困难或者丢失了对特定生成器生成图像的识别能力。比如DIRE通过学习最明显的生成器的特征性伪影,扩散模型的伪影,从而忽略掉了对其他类型生成器也具有的相同的但是不那么明显的伪影特征,导致模型在从未见过的生成器生成的图片上的效果差。

作者通过让模型解构图像特征中通用伪影的核心思想,促进了模型的学习能力和测试的鲁棒性。给定一个由N个不同的生成器组成的生成器集合 g = G 1 , G 2 , . . . , G N , R i = r 1 , r 2 , . . . , r N g={G_1,G_2,...,G_N},R_i={r_1,r_2,...,r_N} g=G1,G2,...,GN,Ri=r1,r2,...,rN和 F i = f 1 , . . . f n F_i={f_1,...f_n} Fi=f1,...fn是输入 G i G_i Gi真实和伪造的样本,让模型在所有数据中学习不同生成模型生成图片的通用伪影。

作者提出的检测范式,对原图的关注区域分块然后打乱,输入特征提取模型CLIP/ViT,得到如下两个输出,将两个输出经过自注意力层提取相同的特征伪影E。再将特征E输入全连接层得到预测标签。

训练的方式是将多个大数据集UFD、GenImageSet之类的数据集合并,然后用这个范式重新构建不同类的检测器进行训练,然后在训练中发现,原始的DIRE、Patchfor这类强拟合模型,训练效果很好,但是测试效果比较差;对于UFD这种强泛化模型,训练集的效果就不太好,测试效果就比较好。

总结

本周学习到了两种深度伪造检测的范式,以及伪造检测的应用,后续将会开展相关的实验。

相关推荐
星马梦缘16 小时前
机器学习与模式识别 第八章 MAP与偏方差 模拟卷及答案
人工智能·机器学习·map·岭回归·mle·双重下降
JackHCC17 小时前
自进化智能体协同进化综述
人工智能·机器学习
星马梦缘17 小时前
机器学习与模式识别 第十二章 自适应学习优化器 考点压缩
人工智能·机器学习·优化器·sgd·adam·rmsprop
qcx2318 小时前
Agentic RAG不止能回答问题,已经能自动修复真实CVE漏洞了
人工智能·机器学习·ai·llm·脑信号
jaychouchannel18 小时前
RecursiveCharacterTextSplitter 中文切分隐形缺陷:重叠、断语义、列表割裂完整复现与修复
人工智能·机器学习
天佑木枫18 小时前
AI:AI 开车撞了人,谁赔钱?——自动驾驶的法律黑洞
人工智能·机器学习·自动驾驶
zhiSiBuYu051719 小时前
混合检索实战指南:关键词与向量的完美融合
人工智能·python·机器学习
2601_9623446219 小时前
计算机毕业设计之基于大数据的手机销售数据对比分析系统
大数据·人工智能·深度学习·机器学习·智能手机·数据挖掘·课程设计
烟锁池塘柳020 小时前
【机器学习】万字长文详解集成学习 Ensemble Learning:从 Bagging、Boosting 到 Stacking 的全解析
机器学习·集成学习·boosting
2601_9623446220 小时前
计算机毕业设计之基于大数据的视频数据分析平台及可视化
java·大数据·人工智能·深度学习·机器学习·数据分析·课程设计