输入序列太长 gan CGAN

transformer序列长度大导致计算复杂度高

GAN

  1. 训练过程

第一阶段:固定「判别器D」,训练「生成器G」。使用一个性能不错的判别器,G不断生成"假数据",然后给这个D去判断。开始时候,G还很弱,所以很容易被判别出来。但随着训练不断进行,G技能不断提升,最终骗过了D。这个时候,D基本属于"瞎猜"的状态,判断是否为假数据的概率为50%。

第二阶段:固定「生成器G」,训练「判别器D」。当通过了第一阶段,继续训练G就没有意义了。这时候我们固定G,然后开始训练D。通过不断训练,D提高了自己的鉴别能力,最终他可以准确判断出假数据。

重复第一阶段、第二阶段。通过不断的循环,「生成器G」和「判别器D」的能力都越来越强。最终我们得到了一个效果非常好的「生成器G」,就可以用它来生成数据。

CGAN

CGAN的核心思想在于将额外的条件信息引入到原始GAN的架构中,使得生成器和判别器在训练过程中同时考虑条件变量。

相关推荐
tigershang25 分钟前
卡尔曼滤波:不确定世界中的最优估计
人工智能·算法·机器学习
深度之眼34 分钟前
2026年因果推断与多目标优化结合的前沿思路
机器学习·多目标优化·因果推断
人工智能培训1 小时前
七大数字技术协同赋能 开启全域智能数字化新时代
人工智能·深度学习·机器学习·生成对抗网络·知识图谱
郑洁文1 小时前
基于机器学习的成都市租房数据的分析与应用
人工智能·机器学习·成都市租房数据·成都市租房数据分析
哥布林学者1 小时前
深度学习进阶(二十九)现代 LLM 的核心架构设计其四:GQA
机器学习·ai
林间码客1 小时前
《人工智能概论》实验4 知识点复习提纲
人工智能·深度学习·机器学习
人工智能培训2 小时前
从GPT到开源大模型
人工智能·gpt·深度学习·机器学习·容器·知识图谱
红宝村村长2 小时前
OPD Reverse KL
机器学习
keykey6.3 小时前
LSTM 文本情感分析:从词嵌入到分类实战
开发语言·人工智能·深度学习·机器学习
数智工坊3 小时前
周志华《Machine Learning》学习笔记--第十三章--半监督学习
笔记·学习·机器学习