Transformer模型奠基者GAN网络

GAN网络为什么这么重要

作为一种生成模型:"GAN 是更好的生成模型""GAN 避免了马尔科夫链式的学习机制""各种类型的损失函数都可以整合到GAN 模型中" "概率密度不可计算时,GAN 仍可以应用" lan J.Goodfellow说

"我们一直在错过一个关键因素就是无监督/预测 学习,这是指:机器给真实环境建模、预测可能的 未来、并通过观察和演示来理解世界是如何运行的 能力。"

"GAN 为创建无监督学习模型提供了强有力的算 法框架,有望帮助我们为 AI 加入常识(CommonSense)。 我们认为,沿着这条路走下去,有不小 的成功机会能开发出更智慧的AI。" Yann LeCun说

GAN网络可以做什么:

· 真实数据生成任务

  • 图像生成 一视频生成

-自然语句生成

-音乐生成

· 解决数据不足问题 一多视角、多任务学习

GAN网络的优缺点

1. 生成对抗网络(GANs)

-优点:生成样本细节清晰

一缺点:优化困难(训练过程不稳定性)

2. 变分自动编码模型(VAE)

一优点:允许带隐变量的概率图模型学习与贝叶斯推断(例如 DRAW,Attend Infer Repeat)

一缺点:生成样本模糊

3. 自回归模型(Auto-regressive)

一优点:简单,稳定的训练过程(例如PixelRNN)

一缺点:采样效率低

CSDN大礼包《大模型应用工程师》

CSDN大礼包《知识图谱构建与应用之人工智能平台开发工程师》

GAN网络基本框架

CSDN大礼包《大模型应用工程师》

CSDN大礼包《知识图谱构建与应用之人工智能平台开发工程师》

GAN网络原理

CSDN大礼包《大模型应用工程师》

CSDN大礼包《知识图谱构建与应用之人工智能平台开发工程师》

GAN网络的特性

优点: ·模型优化只用到了反向传播,而不需要马尔科夫链。

·训练时不需要对隐变量做推断。

·理论上,只要是可微分函数都能用于构建D 和G, 因而能够与深度 神经网络结合->深度产生式模型。

·G 的参数更新不是直接来自于数据样本,而是使用来自D 的反传梯 度。

缺 点 :

·可解释性差:生成模型的分布pg(G)没有显示的表达。

· 比较难训练,D与G之间需要很好的同步,例如D更新k次而G更新1次。

深度GAN网络

深度卷积网络->生成模型,产生分辨率更高、内容更加复杂的数据

基于连续递归神经网络的GAN 模型

可用于处理连续的序列数据,如音乐数据。

· 递归生成网络G: 提供连续数据的序列;递归判别网络D: 区分真实的序列数据和

生成的序列数据。

判别模型

CSDN大礼包《大模型应用工程师》

CSDN大礼包《知识图谱构建与应用之人工智能平台开发工程师》