扩散模型之(十六)像素空间生成模型

1.概述

隐空间扩散:如使用VAE把图像映射到隐空间,然后再进行扩散模型的训练与生成。以往的研究已经表明,

  • VAE会引入一些伪影问题,并且VAE的重建质量决定了扩散模型生成质量的上限。
  • 像素空间扩散:诸如先前JiT等等在像素空间的工作,通过修改预测目标,将原本预测向量场v改为预测原始图像xo,简化了目标,并显著提升了生成质量。然而,论文认为在像素空间中预测完整的图像流形仍然过于复杂的,因为其中包含大量感知上不显著的成分,例如传感器噪声和难以察觉的细节。

2. 像素空间

2.1 DiP

2.2 mean flow

2.3 pMF

2.4 PixelGen

相关推荐
拖拖7652 小时前
深度学习架构的进化:ResNet-v2 与预激活的力量
人工智能
蔚天灿雨2 小时前
Kage:在 Codex、Claude 和 QoderCLI 等 CodingAgentCLI 之间 Fork 与迁移 Session
人工智能·ai·agent·ai编程
no_work2 小时前
yolo摄像头下的目标检测识别集合
人工智能·深度学习·yolo·目标检测·计算机视觉
一只叫煤球的猫2 小时前
为什么不用 RAG 做记忆系统 ——压缩上下文与 memory.md 的架构选择
人工智能·后端·ai编程
智能工业品检测-奇妙智能2 小时前
国产化系统的性价比对比
人工智能·spring boot·后端·openclaw·奇妙智能
咚咚王者2 小时前
人工智能之语言领域 自然语言处理 第十九章 深度学习框架
人工智能·深度学习·自然语言处理
独隅2 小时前
Python AI 全面使用指南:从数据基石到智能决策
开发语言·人工智能·python
啊巴矲2 小时前
小白从零开始勇闯人工智能:机器学习汇总(复习大纲篇)
人工智能
耶叶2 小时前
如何在AndroidStudio里面接入你的AI助手
人工智能·android-studio