GAN:WGAN-DIV

论文:https://arxiv.org/pdf/1712.01026.pdf

代码:

发表:2018

摘要

在计算机视觉的许多领域中,生成对抗性网络已经取得了巨大的成功,其中WGANs系列被认为是最先进的,主要是由于其理论贡献和竞争的定性表现。然而,通过 Wasserstein-1 度量(W-met)来近似 k-Lipschitz约束是非常具有挑战性的。作者提出了一种新的 Wasserstein 散度(W-div),它是W-met的松弛版本,不需要k-Lipschitz约束。

公式

是随机噪声

是真数据

是真数据与假数据的线性混合

是两个超参数

再对比一下wgan-gp与wgan-div的目标函数的差异

在 WGAN-gp 中,为了满足 1-Lipschitz 约束,训练出好效果,采用了真假数据的插值方法,来模拟全空间的均匀分布 。 WGAN-div 的作者说,这种做法是一种机械性的,很难靠有限的采样,模拟出这种全空间分布。

with a finite number of training iterations on limited input samples, it is very difficult to guarantee the k-Lipschitz constraint for the whole input domain.

算法****流程

超参选择-k,p

作者固定p = 6,测试不同的k,结果为右下角:发现变化不大。FID基本在16附近。

作者固定k = 2,测试不同的p,结果为左下角:发现p=6时取得最优FID数值。

同时左上角也可以看出wgan-div的收敛速度最快

稳定性实验

4种设置: ResNet, ResNet without BN, ConvNet, ConvNet without BN

实验结果:ResNet 要好于 ConvNet, 有BN 要好于无BN

参考:

1:Wasserstein Divergence for GANs (WGAN-div) 计算W散度 | 莫烦Python

2:WGAN-div:默默无闻的WGAN填坑者(附开源代码) - 知乎

相关推荐
阿里云大数据AI技术3 分钟前
Post-Training on PAI (3): 自研高性能强化学习框架PAI-ChatLearn
人工智能·开源·强化学习
二二孚日5 分钟前
自用华为ICT云赛道AI第三章知识点-MindSpore特性、MindSpore开发组件
人工智能·华为
水龙吟啸5 分钟前
从零开始搭建深度学习大厦系列-2.卷积神经网络基础(5-9)
人工智能·pytorch·深度学习·cnn·mxnet
杰夫贾维斯16 分钟前
CentOS Linux 8 的系统部署 Qwen2.5-7B -Instruct-AWQ
linux·运维·人工智能·机器学习·centos
m0_7033236717 分钟前
SEO外包服务甄选指南:避开陷阱,精准匹配
大数据·人工智能
金智维科技23 分钟前
多系统、跨流程、高重复?看烟草企业如何用数字员工撬动运营变革
人工智能
PyAIExplorer34 分钟前
图像处理中的边缘填充:原理与实践
图像处理·人工智能
AI大模型技术社44 分钟前
🔥企业级必读:筛选高可用MCP服务的黄金标准
人工智能·mcp
zzywxc7871 小时前
AI技术通过提示词工程(Prompt Engineering)正在深度重塑职场生态和行业格局,这种变革不仅体现在效率提升,更在重构人机协作模式。
java·大数据·开发语言·人工智能·spring·重构·prompt
Java中文社群1 小时前
炸裂!Dify新版发布:内置MCP双向支持!
人工智能·后端