深度学习11--GAN进阶与变种

基础 GAN 存在的问题

在开始讲解变种之前,首先讲一下GAN 存在的问题。第一个问题就是判别器D太强了,损失都是0。假设判别器D能力强,G vl生成的图片与真实图片相差巨大,G v2生成的图片与真实图片相差不多,但是判别器都能完美地识别出所有的正负样本,这样就无法知道G v1更好还是G v2更好了。第二个问题就是生成多样性的问题,也称为Mode Collapse。

反卷积

去卷积、反卷积、上采样,都是一个概念,都是扩大特征图尺寸的,英文是 Deconvolution。

空洞卷积

空洞卷积就是扩张、膨胀之意。卷积核的大小,通常就意味 着感受野的大小,卷积核越大,感受野就越大,但是相应的计算量也会成倍地增加。

在WGAN 出现之前,如何解决Loss=0 的梯度消失问题呢?可以在真实图片和生成 图片上增加噪声,以试图增加两个分布的宽度,来让他们产生重叠。这里举一个极端的例 子,假设两个图片都加上百分之百的服从正态分布的噪声,那么这张图片不管原来如何,现在一定服从同一个分布。通过增加噪声,来强行拉近Pdata和Pg 的距离。然后随着训练的 进行,增加的正态分布的噪声的方差逐渐减小,以至于最后去掉噪声,这也是退火算法的一 种体现。这个方法仅仅解决了判别器过强导致的梯度消失问题,梯度不稳定和多样性问题依旧 没有办法解决,而这两个问题是由于KL 和 JS距离的性质导致的,所以WGAN 提出的办法 就是使用Wasserstein 距离代替JS 散度,实现质的优化。

那么如果想把GAN 改成WGAN, 那么如何操作呢?主要有4个部分:

(1)修改判别器D 的 Loss函数;

(2)修改生成器G 的 Loss函数;

(3)去掉判别器D 的最后一个Sigmoid 层;

(4)增加Weight Clipping。

太大了,会造成梯度爆炸问题,太小 了,会造成梯度消失问题。GP 项是对每一个样本都进行独立的梯度惩罚,因此需要保证每一个样本的独立性,所 以在模型中不能使用BN, 因为BN 层会让同一个 Batch 的不同样本之间产生关系。

VAE-GAN

(1)VAE 缺点:生成图像比GAN 模糊。

(2)GAN 缺点:模型坍塌 mode collapse和梯度消失。

生成器G 的 Loss 函数包含3个部分:

(1)生成图像应该更接近原始图像,而且生成的 mean 和logstd也应该满足标准分布;

(2)生成图像应该可以被Classifier 判断出对应的类别;

(3)生成图像应该可以被判别器D 判断成是真实的图像。

相关推荐
Channing Lewis3 分钟前
如果科技足够发达,是否还需要维持自然系统(例如生物多样性)中那种‘冗余’和‘多样性’,还是可以只保留最优解?
大数据·人工智能·科技
禺垣4 分钟前
区块链技术概述
大数据·人工智能·分布式·物联网·去中心化·区块链
IT科技那点事儿12 分钟前
引领AI安全新时代 Accelerate 2025北亚巡展·北京站成功举办
人工智能·安全
新智元20 分钟前
美 IT 业裁员狂飙 35%,「硅谷梦」彻底崩塌!打工人怒喷 PIP
人工智能·openai
新智元22 分钟前
乔布斯挚友去世!胰腺癌再夺硅谷天才,曾写下苹果「创世代码」
人工智能·openai
春末的南方城市25 分钟前
中山大学&美团&港科大提出首个音频驱动多人对话视频生成MultiTalk,输入一个音频和提示,即可生成对应唇部、音频交互视频。
人工智能·python·深度学习·计算机视觉·transformer
春末的南方城市28 分钟前
Ctrl-Crash 助力交通安全:可控生成逼真车祸视频,防患于未然
人工智能·计算机视觉·自然语言处理·aigc·音视频
程序边界34 分钟前
全球人工智能技术大会(GAITC 2025):技术前沿与产业融合的深度交响
人工智能
OpenCSG42 分钟前
电子行业AI赋能软件开发经典案例——某金融软件公司
人工智能·算法·金融·开源
新加坡内哥谈技术1 小时前
极客时间:在 Google Colab 上尝试 Prefix Tuning
人工智能