扩散模型之(十六)像素空间生成模型

1.概述

隐空间扩散:如使用VAE把图像映射到隐空间,然后再进行扩散模型的训练与生成。以往的研究已经表明,

  • VAE会引入一些伪影问题,并且VAE的重建质量决定了扩散模型生成质量的上限。
  • 像素空间扩散:诸如先前JiT等等在像素空间的工作,通过修改预测目标,将原本预测向量场v改为预测原始图像xo,简化了目标,并显著提升了生成质量。然而,论文认为在像素空间中预测完整的图像流形仍然过于复杂的,因为其中包含大量感知上不显著的成分,例如传感器噪声和难以察觉的细节。

2. 像素空间

2.1 DiP

2.2 mean flow

2.3 pMF

2.4 PixelGen

相关推荐
网教盟人才服务平台12 分钟前
“方班预备班盾立方人才培养计划”正式启动!
大数据·人工智能
芯智工坊22 分钟前
第15章 Mosquitto生产环境部署实践
人工智能·mqtt·开源
菜菜艾22 分钟前
基于llama.cpp部署私有大模型
linux·运维·服务器·人工智能·ai·云计算·ai编程
TDengine (老段)37 分钟前
TDengine IDMP 可视化 —— 分享
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据·时序数据
小真zzz41 分钟前
搜极星:第三方多平台中立GEO洞察专家全面解析
人工智能·搜索引擎·seo·geo·中立·第三方平台
GreenTea1 小时前
从 Claw-Code 看 AI 驱动的大型项目开发:2 人 + 10 个自治 Agent 如何产出 48K 行 Rust 代码
前端·人工智能·后端
火山引擎开发者社区2 小时前
秒级创建实例,火山引擎 Milvus Serverless 让 AI Agent 开发更快更省
人工智能
冬奇Lab2 小时前
一天一个开源项目(第72篇):everything-claude-code - 最系统化的 Claude Code 增强框架
人工智能·开源·资讯
火山引擎开发者社区2 小时前
ArkClaw:以 SLI 度量驱动,构建新一代 Agent 全链路可观测体系
人工智能