扩散模型之(十六)像素空间生成模型

1.概述

隐空间扩散:如使用VAE把图像映射到隐空间,然后再进行扩散模型的训练与生成。以往的研究已经表明,

  • VAE会引入一些伪影问题,并且VAE的重建质量决定了扩散模型生成质量的上限。
  • 像素空间扩散:诸如先前JiT等等在像素空间的工作,通过修改预测目标,将原本预测向量场v改为预测原始图像xo,简化了目标,并显著提升了生成质量。然而,论文认为在像素空间中预测完整的图像流形仍然过于复杂的,因为其中包含大量感知上不显著的成分,例如传感器噪声和难以察觉的细节。

2. 像素空间

2.1 DiP

2.2 mean flow

2.3 pMF

2.4 PixelGen

相关推荐
HZZSDSCYZ20 小时前
2026年杭州电商新趋势:专业公司如何引领未来市场
大数据·人工智能·python
心疼你的一切20 小时前
Llama.Cpp 本地大模型极速部署与调用指南
人工智能·ai·aigc·llama
程序员cxuan20 小时前
还在用 xigh 拉满跑?大错特错
人工智能·后端·程序员
完成大叔21 小时前
模块二,Agent的推理模式是什么
人工智能
猫先生Mr.Mao21 小时前
一文梳理主流 LLM 架构技术演进
人工智能·架构·大模型·llm·transformer
土星云SaturnCloud21 小时前
基于 YOLOv8 + ByteTrack 的冷库叉车智能出入库监管系统设计
人工智能·ai·边缘计算
w1wi21 小时前
【AI应用】利用AI生成优雅且可编辑PPT
人工智能·powerpoint·agi
YueJoy.AI21 小时前
AI应用的容器化部署:从Docker到Kubernetes
人工智能·ai·语言模型
北京软秦科技有限公司21 小时前
搭建数字化风控体系,IACheck紧跟一单一库监管步伐,AI报告审核赋能行业合规升级
人工智能
土拨鼠烧电路21 小时前
第6章:重构者——当应用学会自我厮杀
人工智能·重构