GAN:WGAN-DIV

论文:https://arxiv.org/pdf/1712.01026.pdf

代码:

发表:2018

摘要

在计算机视觉的许多领域中,生成对抗性网络已经取得了巨大的成功,其中WGANs系列被认为是最先进的,主要是由于其理论贡献和竞争的定性表现。然而,通过 Wasserstein-1 度量(W-met)来近似 k-Lipschitz约束是非常具有挑战性的。作者提出了一种新的 Wasserstein 散度(W-div),它是W-met的松弛版本,不需要k-Lipschitz约束。

公式

是随机噪声

是真数据

是真数据与假数据的线性混合

是两个超参数

再对比一下wgan-gp与wgan-div的目标函数的差异

在 WGAN-gp 中,为了满足 1-Lipschitz 约束,训练出好效果,采用了真假数据的插值方法,来模拟全空间的均匀分布 。 WGAN-div 的作者说,这种做法是一种机械性的,很难靠有限的采样,模拟出这种全空间分布。

with a finite number of training iterations on limited input samples, it is very difficult to guarantee the k-Lipschitz constraint for the whole input domain.

算法****流程

超参选择-k,p

作者固定p = 6,测试不同的k,结果为右下角:发现变化不大。FID基本在16附近。

作者固定k = 2,测试不同的p,结果为左下角:发现p=6时取得最优FID数值。

同时左上角也可以看出wgan-div的收敛速度最快

稳定性实验

4种设置: ResNet, ResNet without BN, ConvNet, ConvNet without BN

实验结果:ResNet 要好于 ConvNet, 有BN 要好于无BN

参考:

1:Wasserstein Divergence for GANs (WGAN-div) 计算W散度 | 莫烦Python

2:WGAN-div:默默无闻的WGAN填坑者(附开源代码) - 知乎

相关推荐
大模型最新论文速读几秒前
RelayLLM:token 级大小模型接力加速推理
论文阅读·人工智能·深度学习·机器学习·自然语言处理
智驱力人工智能1 分钟前
矿场轨道异物AI监测系统 构建矿山运输安全的智能感知防线 轨道异物检测 基于YOLO的轨道异物识别算法 地铁隧道轨道异物实时预警技术
人工智能·opencv·算法·安全·yolo·边缘计算
杜子不疼.2 分钟前
【AI】重构知识体系:跨模态信息处理与关联理解
人工智能·重构
设计是门艺术4 分钟前
2026 工作总结 PPT 生成工具 TOP5!
人工智能
就这个丶调调4 分钟前
Python学习路线全攻略:从入门到精通
人工智能·python·编程入门·学习路线
格林威5 分钟前
基于灰度投影的快速图像配准:适用于产线在线对位的 5 个核心方法,附 OpenCV+Halcon 实战代码!
人工智能·数码相机·opencv·机器学习·计算机视觉·视觉检测·工业相机
peixiuhui6 分钟前
EdgeGateway 快速开始手册-WEB登录
人工智能·mqtt·边缘计算·iot·modbus·iotgateway·开源网关
Yvonne爱编码7 分钟前
边缘计算与云计算的协同发展:未来算力布局的核心逻辑
人工智能·云计算·边缘计算
叫我:松哥8 分钟前
基于Flask开发的智能招聘平台,集成了AI匹配引擎、数据预测分析和可视化展示功能
人工智能·后端·python·信息可视化·自然语言处理·flask·推荐算法
IT_陈寒8 分钟前
Java开发者必知的5个性能优化技巧,让应用速度提升300%!
前端·人工智能·后端