Stable diffusion(一)

Stable diffusion 原理解读

名词解释
  • 正向扩散(Fixed Forward Diffusion Process):
  • 反向扩散(Generative Reverse Denoising Process)
  • VAE(Variational AutoEncoder):一个用于压缩图片的神经网络,按照我的理解,通过这个模组的图片/文本,将被映射更加精确的向量。
  • Latent Space(潜变量空间):被VAE压缩/升维后的向量。
  • Unet:一个用来预测噪声的图像分割模型
  • CLIP:Tokenizer + Text Encode
  • Sampler:控制迭代次数和迭代总数的规划期。可以有线性规划等规划方式,去分配,在训练中,每一个epoch中加入多少次噪音。
    • 迭代次数:epoch
    • 迭代总数:要加多少次噪音。
Unet原理分析
  1. 图像分割的几种分类。图像分割,就是将像素点达标成thing的过程。
  2. 网络结构
    网络结构就是卷积下采样 + 反卷积/反池化 上采样的过程
  3. 训练集样例
  4. Unet 在stable diffusion中的使用。Unet是用于图像分割的,用于预测像素的分类。在stable diffusion中,就使用它预测噪声,去除噪声。
    1. 在一张图像中,加入随机生成噪声,并且将这张图片和这个噪声分类放到训练集中去。那么就可以通过一张图片,获得有很多图片的训练集。
    2. 训练Unet,将图片中的噪音点打标出来。输入图片,输出噪音。并且将噪音去除,就能从一个噪音图片中还原出一个图像~
图生图/文生图
  1. 将图片压缩成潜在变量/在潜在空间中latent space中随机生成一个噪音图片
  2. 加入随机噪声/文生图略
  3. Unet 预测噪声、去噪
  4. 生成新的图片
相关推荐
孤岛站岗4 天前
【AI大模型入门】B02:Stable Diffusion——开源绘图,让AI绘画飞入寻常百姓家
人工智能·stable diffusion·开源
智星云算力4 天前
从创作到训练:Stable Diffusion WebUI全链路实战
人工智能·深度学习·stable diffusion·智星云·gpu算力租用
ai_xiaogui5 天前
PanelAI 最新进展:AI算力集群一键部署ComfyUI & Stable Diffusion,多节点Docker管理面板从原型到真实数据全解析
人工智能·docker·stable diffusion·ai算力集群管理·ai私有化部署工具·ai容器管理与算力调度实战·多节点docker服务器面板
scott1985126 天前
扩散模型之(二十)Stable Diffusion的运作原理
深度学习·stable diffusion·扩散模型·生成式
xingyuzhisuan6 天前
怎么快速在云上部署一个Stable Diffusion环境?(实操落地版)
人工智能·stable diffusion·ai绘画·gpu算力
scott1985128 天前
扩散模型之(十九)stable diffusion的演进与技术路线
stable diffusion
Jial-(^V^)9 天前
使用Stable-Diffusion实现文本生成图像
stable diffusion
AI成长日志10 天前
【GitHub开源项目专栏】扩散模型开源项目深度解析:Stable Diffusion与ControlNet架构全景
stable diffusion·开源·github
一个没有本领的人12 天前
win11配置Stable-diffusion-1.5
stable diffusion
AI成长日志13 天前
【扩散模型专栏】文本到图像生成实战:Stable Diffusion架构解析与代码实现
人工智能·stable diffusion·架构