文本转图像 学习笔记

VQGAN (Vector Quantized Generative Adversarial Network) 是一种基于 GAN 的生成模型,可以将图像或文本转换为高质量的图像。

VQ (Vector Quantization)是一种数据压缩技术,是指将连续数据表示为离散化的向量。输入的图像或文本被映射到 VQ 空间中的离散化向量表示,然后,离散化向量然后被送到 GAN 模型中进行图像生成。(参见上图的下半部分)在训练过程中,VQGAN 模型会优化两个损失函数:一个用于量化误差(即离散化向量和连续值之间的误差),另一个用于生成器和判别器之间的对抗损失。

GAN 是由生成器和判别器两个模型组成的,生成器负责生成图像,判别器负责判断生成的图像是否为真实的图像。在训练过程中,生成器和判别器相互博弈,不断优化各自的参数,以使生成的图像更接近真实图像。

原文链接:https://blog.csdn.net/qq_42208244/article/details/132889927

VQGAN理论加代码一对一详解,小白向解析-CSDN博客

相关推荐
d111111111d22 分钟前
STM32外设学习-串口发送数据-接收数据(笔记)
笔记·stm32·学习
Elias不吃糖32 分钟前
eventfd 初认识Reactor/多线程服务器的关键唤醒机制
linux·服务器·c++·学习
宋辰月1 小时前
学习react第三天
前端·学习·react.js
昊喵喵博士2 小时前
直接用 JavaScript 给输入框赋值,Vue 页面input只是纯展示 并 没有触发 vue 的v-model 赋值
笔记
月下倩影时2 小时前
视觉学习篇——机器学习模型评价指标
人工智能·学习·机器学习
重启编程之路2 小时前
python 基础学习socket -UDP编程
python·网络协议·学习·udp
Fantasydg2 小时前
MyBatis学习
java·学习·mybatis
卡提西亚3 小时前
C++笔记-26-类模板
c++·笔记
song8546011343 小时前
锁的初步学习
开发语言·python·学习
AI浩4 小时前
人群计数的课程学习——是否值得:
学习