stable diffusion实践操作-SD原理

系列文章目录

本文专门开一节写SD原理相关的内容,在看之前,可以同步关注:
stable diffusion实践操作


文章目录

  • 系列文章目录
  • 前言
  • 一、原理说明
    • 1.1、出图原理
      • [1.1.1 AI画画不是和人一样,从0开始,而是一个去噪点的过程:](#1.1.1 AI画画不是和人一样,从0开始,而是一个去噪点的过程:)
      • [1.1.2 逆向去噪](#1.1.2 逆向去噪)
      • [1.1.3 AI如何学会去噪点的](#1.1.3 AI如何学会去噪点的)
    • 1.2、出图机制
      • [1.2.1 文字编码 CLIP](#1.2.1 文字编码 CLIP)
      • [1.2.2 图片绘制](#1.2.2 图片绘制)
        • [1.2.2.1 随机种子和采样器](#1.2.2.1 随机种子和采样器)
        • [1.2.2.2 迭代步数](#1.2.2.2 迭代步数)
        • [1.2.2.3 采样方法](#1.2.2.3 采样方法)
      • 1.2.3放大图片
  • 总结

前言

(后期补充)


一、原理说明

1.1、出图原理

1.1.1 AI画画不是和人一样,从0开始,而是一个去噪点的过程:

1.1.2 逆向去噪

所有的人图片都是从一张噪点图开始的。根据目标生成一张猫的图片,将噪点一步步转化为猫

1.1.3 AI如何学会去噪点的

AI首先将图片一步步加入噪点。

所以任何一张图都可以逆向这个过程

1.2、出图机制

  1. 将输入的文字进行编码传入潜空间。
  2. 在潜空间根据文字的描述,进行图片的绘制
  3. 将图片从潜空间的压缩态进行放大,补充细节,提升分辨率

1.2.1 文字编码 CLIP

计算机不能直接理解文本和图片

而是通过特征向量来标记

而这一项工作是通过CLIP模型来完成的

clip模型包括文字编码器和图片编码器,将文字和图片都编码成向量

所以CLIP设置的层数越高,图片和文字相关度越低,一般设置为2就可以了。

1.2.2 图片绘制

SD绘制图片内容的时候,并不是直接绘制512512的图片,而是绘制核心内容,64 64,然后再将图片放大还原。

所以绘图的实际过程就是去噪

1.2.2.1 随机种子和采样器

SD会根据随机种子生成一张正态分布的噪点图,然后根据传入的文字,加入是狗,去向量数据库中搜索,生成狗的去噪方式。去噪方式又是采样器进行调用的

采样器会调用Unet模型,对图片中的噪点预测,生成噪点预测图

让噪点图减去预测出的全部噪点,生成最终的模型图片

1.2.2.2 迭代步数

Unet模型在噪点多的时候,预测并不理想,所以我们并不一次性全部采纳其预测的噪点,而是每次只采用一部分噪点,循环多次

这个过程就是下面的迭代步数

设置过小,图片与文本匹配度较低,过大,则会画蛇添足,一般我们设置为20-40步即可

1.2.2.3 采样方法

采样所采用的算法,不同算法消耗的时间不同。

采样器时间对比

一般推荐大家 使用DPM++ SDE Karas/DPM2++ SDE Karas

对比:


1.2.3放大图片

在潜空间产生的图片比较小,我们需要VAE将其放大,优化细节。

这就是整个过程


总结

例如:以上就是今天要讲的内容。

相关推荐
三无推导1 天前
ComfyUI 安装部署教程:Windows 下快速搭建可视化 AI 绘图工作流,零基础也能跑通
人工智能·pytorch·windows·stable diffusion·aigc·ai绘画·持续部署
code_pgf1 天前
ViT 与 MAE 在图像特征提取方面的优势详解
人工智能·stable diffusion
code_pgf2 天前
多模态技术在主要 AI 应用领域中的应用分析与工程落地建议
人工智能·stable diffusion
程序员大辉3 天前
Z-Image迷你整合包:只有10G大小,5G小显存也能跑的Stable Diffusion文生图工具
stable diffusion·文生图·sd·z-image
嗝o゚4 天前
昇腾CANN cann-recipes-infer 仓:Stable Diffusion 推理加速方案
人工智能·stable diffusion·cann
菜鸟是大神5 天前
04-高效编写CLAUDE.md
数据库·chatgpt·ai作画·stable diffusion·文心一言·dall·e 2
Rocky Ding*7 天前
昔日AI绘画框架王者Stable Diffusion WebUI,已死
人工智能·深度学习·机器学习·chatgpt·ai作画·stable diffusion·aigc
艾古力斯8 天前
比迪丽AI绘画模型Python爬虫实战:自动化采集艺术素材
stable diffusion·ai绘画·python爬虫
风落无尘9 天前
Stable Diffusion WebUI & ComfyUI 完整安装教程:官方部署+一键整合包+Docker容器化(2026最新)
docker·容器·stable diffusion
code_pgf10 天前
Stable-Diffusion模型中常见 Stable Diffusion Sampling 方法
人工智能·stable diffusion