【HUAWEI】HCIP-AI-MindSpore Developer V1.0 | 第一章 神经网络基础(4 生成对抗网络 ) | 学习笔记

目录

[第一章 神经网络基础](#第一章 神经网络基础)

[4 生成对抗网络](#4 生成对抗网络)

[▲ 生成对抗网络简介](#▲ 生成对抗网络简介)

GAN

生成对抗网络

GAN的基本结构

生成对抗网络目标函数

训练生成对抗网络

训练判别器

训练生成器

生成对抗网络训练中的问题

欠拟合以及过拟合的问题

生成对抗网络中的模式崩塌

生成对抗网络训练不稳定的问题

[第一章 测一测](#第一章 测一测)



第一章 神经网络基础

4 生成对抗网络

▲ 生成对抗网络简介

GAN

生成对抗网络( Generative Adversarial Network , GAN )最初由Goodfellow 等人于 2014 年提出,是近年来最流行的生成模型之一。生成对抗网络可以看作由两种模型组成,分别是++++生成模型++++ 和++++判别模型++++,通过生成模型和判别模型的博弈来进行训练。原始的生成对抗网络的目标是学习真实数据分布,生成和数据集中的图像相似但不完全相同的图像。

生成对抗网络

生成对抗网络( Generative Adversarial Network , GAN ) 是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。生成对抗网络由一个生成网络 G( Generator )与一个判别网络 D( Discriminator )组成

****◎****生成网络从潜在空间( latent space )中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本。

****◎****判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。

生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

GAN的基本结构
生成对抗网络目标函数
训练生成对抗网络

训练生成对抗网络可以用基于成熟的梯度下降算法的优化器,例如Adam优化器。在训练时可以使用反向传播算法来更新参数。值得注意的是,和其他深度学习不同的是,由于生成模型和判别模型的目标不同,因此需要分开训练生成模型和判别模型。此外,由于一开始生成模型只能生成一些质量很差的图像例如噪声,而判别模型也只能判别噪声和真实图像,因此生成模型和判别模型需要交替训练,你追我赶,共同进化

训练判别器

训练判别器的目标是能**++++分辨真实图像和生成图像++++**。即当输入图像为真实图像时,希望输出结果越接近"1"越好,当输入生成图像时,希望输出越接近"0"越好。在训练判别器时,我们需要固定住生成器中的参数。

可以很直觉地理解:如果不固定生成器的参数,可以通过降低生成图像的质量来"帮助"判别器进行分辨。

训练生成器

训练生成器的目标是**++++能"骗过"判别器,让判别器判断不出真实图像和生成图像++++**。即当生成的图像进入判别器时,希望输出结果越接近"1"越好。在训练生成器时,我们需要固定判别器中的参数。

可以很直觉地理解:如果不固定判别器的参数,可以通过降低判别器的判别性能,把任何图像都当成真实图像。

生成对抗网络训练中的问题
欠拟合以及过拟合的问题

生成对抗网络中的欠拟合 :生成对抗网络无法生成高质量的图像。这是生成对抗网络中一直在研究的一个问题,即如何提高生成图像的质量。而导致欠拟合的很重要的原因之一就是模型的生成能力不足。因此,可以通过适当增加原始网络中隐藏层的层数以及神经元的数量来尝试缓解欠拟合的问题。此外还可以通过改变网络结构等方法来缓解欠拟合的问题,例如使用深度卷积生成对抗网络( DCGAN )。

生成对抗网络中的过拟合 :生成对抗网络生成的图像和数据集中的图像一致或仅进行了平移等。同样可以通过增加训练集的数量以及使用 Dropout 等方法来缓解过拟合的问题。

生成对抗网络中的模式崩塌

模式崩塌是生成对抗网络中非常特殊的一个问题,即模型无法生成多样性的图像。例如,如果将 MNIST 作为数据集,希望生成一个数字"0"到数字"9"的图像。生成模型很可能会"偷懒",只生成容易生成的数字,例如"1";而不去生成难度较大的数字,例如"8"。

可以很直觉地理解:只要生成模型生成质量足够好的" 1 ",同样能够达到"骗过"判别模型的目的。

模式崩塌是目前仍然尚待解决的问题,幸运的是,已经有很多论文提出了各种方法来缓解模型崩塌的问题。例如 VEEGAN , AdaGAN , MAD-GAN 等。

生成对抗网络训练不稳定的问题

梯度消失的问题:在刚开始训练生成对抗网络时,很容易出现梯度消失的问题。这是由于判别模型训练得"太好"或者"太差"导致生成模型无法继续训练。

难以收敛的问题:在训练生成对抗网络的后期,很可能出现生成模型难以收敛的问题。

目前,已经有很多论文提出改变生成对抗网络的目标函数来缓解生成对抗网络训练不稳定的问题。例如 LSGAN , WGAN , WGAN-GP 等。

第一章 测一测

说明:本文内容来源于网络,仅作为学习用途,如有侵权,请联系作者删除。

相关推荐
泰迪智能科技5 小时前
分享|职业技术培训|数字技术应用工程师快问快答
人工智能
C雨后彩虹5 小时前
任务最优调度
java·数据结构·算法·华为·面试
晓幂7 小时前
【2025】HECTF
笔记·学习·web安全
Dxy12393102167 小时前
如何给AI提问:让机器高效理解你的需求
人工智能
少林码僧7 小时前
2.31 机器学习神器项目实战:如何在真实项目中应用XGBoost等算法
人工智能·python·算法·机器学习·ai·数据挖掘
钱彬 (Qian Bin)7 小时前
项目实践15—全球证件智能识别系统(切换为Qwen3-VL-8B-Instruct图文多模态大模型)
人工智能·算法·机器学习·多模态·全球证件识别
没学上了7 小时前
CNNMNIST
人工智能·深度学习
宝贝儿好7 小时前
【强化学习】第六章:无模型控制:在轨MC控制、在轨时序差分学习(Sarsa)、离轨学习(Q-learning)
人工智能·python·深度学习·学习·机器学习·机器人
做cv的小昊8 小时前
【TJU】信息检索与分析课程笔记和练习(8)(9)发现系统和全文获取、专利与知识产权基本知识
大数据·笔记·学习·全文检索·信息检索
智驱力人工智能8 小时前
守护流动的规则 基于视觉分析的穿越导流线区检测技术工程实践 交通路口导流区穿越实时预警技术 智慧交通部署指南
人工智能·opencv·安全·目标检测·计算机视觉·cnn·边缘计算