GAN:WGAN-DIV

论文:https://arxiv.org/pdf/1712.01026.pdf

代码:

发表:2018

摘要

在计算机视觉的许多领域中,生成对抗性网络已经取得了巨大的成功,其中WGANs系列被认为是最先进的,主要是由于其理论贡献和竞争的定性表现。然而,通过 Wasserstein-1 度量(W-met)来近似 k-Lipschitz约束是非常具有挑战性的。作者提出了一种新的 Wasserstein 散度(W-div),它是W-met的松弛版本,不需要k-Lipschitz约束。

公式

是随机噪声

是真数据

是真数据与假数据的线性混合

是两个超参数

再对比一下wgan-gp与wgan-div的目标函数的差异

在 WGAN-gp 中,为了满足 1-Lipschitz 约束,训练出好效果,采用了真假数据的插值方法,来模拟全空间的均匀分布 。 WGAN-div 的作者说,这种做法是一种机械性的,很难靠有限的采样,模拟出这种全空间分布。

with a finite number of training iterations on limited input samples, it is very difficult to guarantee the k-Lipschitz constraint for the whole input domain.

算法****流程

超参选择-k,p

作者固定p = 6,测试不同的k,结果为右下角:发现变化不大。FID基本在16附近。

作者固定k = 2,测试不同的p,结果为左下角:发现p=6时取得最优FID数值。

同时左上角也可以看出wgan-div的收敛速度最快

稳定性实验

4种设置: ResNet, ResNet without BN, ConvNet, ConvNet without BN

实验结果:ResNet 要好于 ConvNet, 有BN 要好于无BN

参考:

1:Wasserstein Divergence for GANs (WGAN-div) 计算W散度 | 莫烦Python

2:WGAN-div:默默无闻的WGAN填坑者(附开源代码) - 知乎

相关推荐
攻城狮7号11 小时前
SaaS的末日重构:AI Agent浪潮下的危机与新生
人工智能·ai agent·saas末日·saas升级重构
2601_9499251811 小时前
空运舱位突发爆舱?解析 AI Agent 如何在 2 小时内重构物流应急响应底层逻辑
人工智能·重构·物流rpa
FluxMelodySun11 小时前
机器学习(二十八) 特征选择与常见的特征选择方法
人工智能·机器学习
小陈工11 小时前
2026年3月31日技术资讯洞察:AI智能体安全、异步编程突破与Python运行时演进
开发语言·jvm·数据库·人工智能·python·安全·oracle
香港科大商学院内地办事处11 小时前
港科资讯|郑光廷教授出席国际科技组织发展与全球科技治理论坛 分享协作实践
人工智能·科技
Westward-sun.11 小时前
基于 OpenCV DNN 模块实现图像风格迁移
人工智能·神经网络·opencv·计算机视觉·dnn
AI枫林晚11 小时前
源码解析Claude Code 项目 queryLoop 运行机制分析
人工智能·架构
AI攻城狮11 小时前
OpenClaw Exec Approvals 机制:在安全与效率之间寻找平衡
人工智能·云原生·aigc
太难了啊11 小时前
5分钟实现你的第一个 Node.js 智能体
人工智能·node.js
灵机一物11 小时前
灵机一物AI智能电商小程序(已上线)-从需求到上线,2天用AI搞定电商签到、分享送积分功能
人工智能·ai编程·github copilot·claude code·电商开发·积分系统·全流程开发