输入序列太长 gan CGAN

transformer序列长度大导致计算复杂度高

GAN

  1. 训练过程

第一阶段:固定「判别器D」,训练「生成器G」。使用一个性能不错的判别器,G不断生成"假数据",然后给这个D去判断。开始时候,G还很弱,所以很容易被判别出来。但随着训练不断进行,G技能不断提升,最终骗过了D。这个时候,D基本属于"瞎猜"的状态,判断是否为假数据的概率为50%。

第二阶段:固定「生成器G」,训练「判别器D」。当通过了第一阶段,继续训练G就没有意义了。这时候我们固定G,然后开始训练D。通过不断训练,D提高了自己的鉴别能力,最终他可以准确判断出假数据。

重复第一阶段、第二阶段。通过不断的循环,「生成器G」和「判别器D」的能力都越来越强。最终我们得到了一个效果非常好的「生成器G」,就可以用它来生成数据。

CGAN

CGAN的核心思想在于将额外的条件信息引入到原始GAN的架构中,使得生成器和判别器在训练过程中同时考虑条件变量。

相关推荐
秀儿还能再秀4 小时前
神经网络(系统性学习四):深度学习——卷积神经网络(CNN)
人工智能·深度学习·机器学习·cnn·学习笔记
归-途6 小时前
C#构建一个简单的循环神经网络,模拟对话
神经网络·机器学习·c#
归-途7 小时前
C#构建一个简单的前馈神经网络
神经网络·机器学习·c#
慕卿扬8 小时前
基于python的机器学习(四)—— 聚类(一)
笔记·python·学习·机器学习·聚类
静能生慧8 小时前
大模型-微调与对齐-非强化学习的对齐方法
人工智能·深度学习·机器学习·大模型
爱吃土豆的程序员9 小时前
深入理解 prompt提示词 原理及使用技巧
人工智能·深度学习·机器学习·prompt
宋一诺339 小时前
机器学习—迁移学习:使用其他任务中的数据
人工智能·机器学习·迁移学习
炸膛坦客10 小时前
神经网络入门实战:(一)神经网络解决的两种问题,以及AI、机器学习、深度学习三者之间的逻辑关系
人工智能·深度学习·机器学习
友艺11 小时前
CatBoost 模型实践:回归与分类的全流程解析
机器学习
彭彭不吃虫子13 小时前
【离散数学】特殊关系的矩阵表示
决策树·机器学习·矩阵