Stable diffusion(一)

Stable diffusion 原理解读

名词解释
  • 正向扩散(Fixed Forward Diffusion Process):
  • 反向扩散(Generative Reverse Denoising Process)
  • VAE(Variational AutoEncoder):一个用于压缩图片的神经网络,按照我的理解,通过这个模组的图片/文本,将被映射更加精确的向量。
  • Latent Space(潜变量空间):被VAE压缩/升维后的向量。
  • Unet:一个用来预测噪声的图像分割模型
  • CLIP:Tokenizer + Text Encode
  • Sampler:控制迭代次数和迭代总数的规划期。可以有线性规划等规划方式,去分配,在训练中,每一个epoch中加入多少次噪音。
    • 迭代次数:epoch
    • 迭代总数:要加多少次噪音。
Unet原理分析
  1. 图像分割的几种分类。图像分割,就是将像素点达标成thing的过程。
  2. 网络结构
    网络结构就是卷积下采样 + 反卷积/反池化 上采样的过程
  3. 训练集样例
  4. Unet 在stable diffusion中的使用。Unet是用于图像分割的,用于预测像素的分类。在stable diffusion中,就使用它预测噪声,去除噪声。
    1. 在一张图像中,加入随机生成噪声,并且将这张图片和这个噪声分类放到训练集中去。那么就可以通过一张图片,获得有很多图片的训练集。
    2. 训练Unet,将图片中的噪音点打标出来。输入图片,输出噪音。并且将噪音去除,就能从一个噪音图片中还原出一个图像~
图生图/文生图
  1. 将图片压缩成潜在变量/在潜在空间中latent space中随机生成一个噪音图片
  2. 加入随机噪声/文生图略
  3. Unet 预测噪声、去噪
  4. 生成新的图片
相关推荐
北上ing1 天前
从FP32到BF16,再到混合精度的全景解析
人工智能·pytorch·深度学习·计算机视觉·stable diffusion
源客z2 天前
搭建Stable Diffusion图像生成系统实现通过网址访问(Ngrok+Flask实现项目系统公网测试,轻量易部署)
stable diffusion
源客z3 天前
搭建 Stable Diffusion 图像生成系统并通过 Ngrok 暴露到公网(实现本地系统网络访问)——项目记录
stable diffusion
朴拙数科5 天前
Stable Diffusion秋叶整合包V4独立版Python本地API连接指南
开发语言·python·stable diffusion
璇转的鱼6 天前
爆肝整理!Stable Diffusion的完全使用手册(二)
人工智能·ai作画·stable diffusion·aigc
曲幽7 天前
Stable Diffusion LoRA模型加载实现风格自由
python·ai·stable diffusion·lora·文生图·diffusers
nan_black9 天前
在Pycharm配置stable diffusion环境(使用conda虚拟环境)
stable diffusion·pycharm·conda
AI绘画咪酱9 天前
Stable Diffusion【进阶篇】:如何实现人脸一致
人工智能·深度学习·学习·机器学习·ai作画·stable diffusion
AIGC-Lison10 天前
AI绘画SD中,如何保持生成人物角色脸部一致?Stable Diffusion精准控制AI人像一致性两种实用方法教程!
人工智能·ai作画·stable diffusion·midjourney·sd
AI绘画咪酱11 天前
SD教程|巧用Stable Diffusion,实现不同风格的LOGO设计|实战篇幅,建议收藏!
人工智能·学习·ai作画·stable diffusion·sd