文本转图像 学习笔记

VQGAN (Vector Quantized Generative Adversarial Network) 是一种基于 GAN 的生成模型,可以将图像或文本转换为高质量的图像。

VQ (Vector Quantization)是一种数据压缩技术,是指将连续数据表示为离散化的向量。输入的图像或文本被映射到 VQ 空间中的离散化向量表示,然后,离散化向量然后被送到 GAN 模型中进行图像生成。(参见上图的下半部分)在训练过程中,VQGAN 模型会优化两个损失函数:一个用于量化误差(即离散化向量和连续值之间的误差),另一个用于生成器和判别器之间的对抗损失。

GAN 是由生成器和判别器两个模型组成的,生成器负责生成图像,判别器负责判断生成的图像是否为真实的图像。在训练过程中,生成器和判别器相互博弈,不断优化各自的参数,以使生成的图像更接近真实图像。

原文链接:https://blog.csdn.net/qq_42208244/article/details/132889927

VQGAN理论加代码一对一详解,小白向解析-CSDN博客

相关推荐
qq_397562318 分钟前
昆仑通态, ModbusTCP数据转发, 驱动,使用笔记
笔记
阿豪只会阿巴25 分钟前
【多喝热水系列】从零开始的ROS2之旅——Day9 初识话题通信:基本命令
c++·笔记·python·ubuntu·ros2
崎岖Qiu37 分钟前
【OS笔记44】:磁盘存储管理
笔记·操作系统·os
周周记笔记1 小时前
ESP32-S3 :开发方式笔记(五)
笔记·单片机·嵌入式硬件
June bug1 小时前
【实习笔记】Fiddler学习笔记
笔记·学习·fiddler
googleccsdn1 小时前
ENSP Pro Lab笔记:配置BGP EVPN VXLAN双栈(2)
网络·笔记·网络协议
我怕是好1 小时前
学习STM32 ESP8266
stm32·嵌入式硬件·学习
JeffDingAI1 小时前
【Datawhale学习笔记】动手学RNN及LSTM
笔记·rnn·学习
风之子npu2 小时前
CPU基础知识(1)
笔记
JeffDingAI2 小时前
【Datawhale学习笔记】预训练模型实战
笔记·学习