生成对抗网络GAN的扩展应用理解

:本文仅个人学习理解,如需详细内容请看原论文!

一、cycleGAN

1.整体架构:

将图片A通过生成器生成图片B,然后通过判别器判别图片B的真假;并且图片B通过另一个生成器生成A',让A和A'近似。

2.4种损失函数:

G网络、D网络、Cycle、Identity,D网络中使用了PatchGAN。

3.PatchGAN的作用:

​ 输出的是一个N × N的矩阵,需要基于感受野来计算损失;基于感受野在特征图上的预测结果,和标签(也需要设置成N x N)计算损失。

​ 每个圆圈代表一个patch。

二、starGAN v1

1.生成器:

通过输入input image、目标域(目标风格)然后输出fake image;

将fake image与原始信号再次输入到生成器G中,生成Reconstructed image,使Reconstructed image与input image 越接近越好;

将fake image再次输入到判别器D中,然后通过类别判断真假。

2.判别器:

输入real image 和 fake image,通过判别器D输出图片的真假,以及分类结果

三、starGAN v2

引入了 Mapping network 与 Style encoder

1.Generator:

加入style编码,通过Mapping network 和 Style encoder编码

2.Mapping network:

输入:随机初始化一个向量,如16维向量Z(原图像);在传入一个reference(提供风格的图像)。

输出:64维向量,经过风格转换的图像。

组成:一些全连接网络构成。

3.Style encoder:

将原始的图像X做一个编码E(X)得到一个64维的向量。

4.Discriminator:

输出多分支结果,假设有3种风格,就会输出6种结果,每种风格都会产生2种结果。

相关推荐
铭瑾熙3 分钟前
深度学习之人脸检测
人工智能·深度学习
白光白光34 分钟前
量子卷积神经网络
人工智能·神经网络·cnn
陈苏同学2 小时前
机器翻译 & 数据集 (NLP基础 - 预处理 → tokenize → 词表 → 截断/填充 → 迭代器) + 代码实现 —— 笔记3.9《动手学深度学习》
人工智能·pytorch·笔记·python·深度学习·自然语言处理·机器翻译
狂放不羁霸2 小时前
组会 | 大语言模型 + LoRA
人工智能·语言模型·自然语言处理
sp_fyf_20242 小时前
【大语言模型】ACL2024论文-20 SCIMON:面向新颖性的科学启示机器优化
人工智能·深度学习·机器学习·语言模型·自然语言处理·数据挖掘
宋138102797202 小时前
SouVR Feedback force7 力反馈设备
人工智能·机器人·vr
我叫白小猿3 小时前
【大模型-智能体】AutoGen Studio测试和导出工作流程
人工智能·python·workflow·工作流·智能体·autogen
CopyLower3 小时前
AI赋能电商:智能购物推荐、会员分类与商品定价的创新探索
人工智能·分类·数据挖掘
界面开发小八哥3 小时前
界面控件DevExpress WinForms v24.2新功能预览 - 人工智能(AI)
人工智能·.net·界面控件·devexpress·ui开发
2zcode3 小时前
基于YOLOv8深度学习的独居老人情感状态监护系统(PyQt5界面+数据集+训练代码)
人工智能·深度学习·yolo