输入序列太长 gan CGAN

transformer序列长度大导致计算复杂度高

GAN

  1. 训练过程

第一阶段:固定「判别器D」,训练「生成器G」。使用一个性能不错的判别器,G不断生成"假数据",然后给这个D去判断。开始时候,G还很弱,所以很容易被判别出来。但随着训练不断进行,G技能不断提升,最终骗过了D。这个时候,D基本属于"瞎猜"的状态,判断是否为假数据的概率为50%。

第二阶段:固定「生成器G」,训练「判别器D」。当通过了第一阶段,继续训练G就没有意义了。这时候我们固定G,然后开始训练D。通过不断训练,D提高了自己的鉴别能力,最终他可以准确判断出假数据。

重复第一阶段、第二阶段。通过不断的循环,「生成器G」和「判别器D」的能力都越来越强。最终我们得到了一个效果非常好的「生成器G」,就可以用它来生成数据。

CGAN

CGAN的核心思想在于将额外的条件信息引入到原始GAN的架构中,使得生成器和判别器在训练过程中同时考虑条件变量。

相关推荐
PhotonixBay4 小时前
共聚焦显微镜的结构组成与应用
人工智能·算法·机器学习
佚名ano6 小时前
支持向量机SVM的简单推导过程
算法·机器学习·支持向量机
lisw056 小时前
用于实时数据处理的边缘计算!
人工智能·机器学习·边缘计算
全栈开发圈6 小时前
干货分享|R语言聚类分析2
人工智能·机器学习·r语言
shangjian0076 小时前
AI-大语言模型-模型训练-数据集1-总述
人工智能·机器学习·语言模型
zadyd7 小时前
一个基本的意图识别该包含哪些内容
人工智能·机器学习
zm-v-159304339868 小时前
Python 气象数据处理从入门到精通:机器学习订正 + 深度学习预测完整教程
python·深度学习·机器学习
shangjian0078 小时前
AI-大语言模型-模型训练-数据集2-数据规模要求
人工智能·机器学习·语言模型
Dfreedom.9 小时前
机器学习经典算法全景解析与演进脉络(监督学习篇)
人工智能·学习·算法·机器学习·监督学习
夏星印9 小时前
学习吴恩达课程机器学习笔记
人工智能·笔记·学习·机器学习·ai