Stable diffusion 3.0

Esser P, Kulal S, Blattmann A, et al. Scaling rectified flow transformers for high-resolution image synthesis[C]//Forty-first International Conference on Machine Learning. 2024.

https://github.com/huggingface/diffusers/releases/tag/v0.29.0

https://huggingface.co/stabilityai/stable-diffusion-3-medium-diffusers

https://huggingface.co/docs/diffusers/main/en/api/pipelines/stable_diffusion/stable_diffusion_3

实验过程

  1. 安装依赖:

    bash 复制代码
    pip install -U diffusers
    pip install transformers
    pip install sentencepiece
  2. 在 huggingface 上申请 SD3 并创建 Token,然后在终端进行登录:

  3. 随后就可以使用 demo 进行推理,第一次下载模型较慢,以后每次调用可以直接加载模型进行推理:

    需要注意的是,预训练模型会下载到 cache 文件夹下,如果想要更改位置,可以提前设置 HF_HOMEHUGGINFACE_HUB_CACHE 环境变量 [1](#1)

实验结果

a photo of an astronaut riding a horse on mars:

a photo of a Lamborghini racing on the track:

a photo of the night scenery of Chongqing:

a photo of the Great Wall:

A poster of Ferrari:

A wallpaper of NBA stars:


  1. Diffusers ↩︎
相关推荐
RanceGru2 天前
LLM学习笔记5——本地部署ComfyUI和Wan2.1-T2V-1.3B文生视频模型
笔记·学习·stable diffusion·transformer
AI生成未来2 天前
统一高效图像生成与编辑!百度&新加坡国立提出Query-Kontext,多项任务“反杀”专用模型
多模态·扩散模型·图像生成
ding_zhikai3 天前
stable-diffusion试验1-静态人物
stable diffusion
love530love5 天前
【笔记】 Podman Desktop 中部署 Stable Diffusion WebUI (GPU 支持)
人工智能·windows·笔记·python·容器·stable diffusion·podman
迈火6 天前
PuLID_ComfyUI:ComfyUI中的图像生成强化插件
开发语言·人工智能·python·深度学习·计算机视觉·stable diffusion·语音识别
ding_zhikai7 天前
SD:在一个 Ubuntu 系统安装 stable diffusion Web UI
前端·ubuntu·stable diffusion
不当菜鸡的程序媛7 天前
Stable Diffusion里面Cross-Attention设计:为啥Q来自图像/噪声,K和V来自文本
人工智能·计算机视觉·stable diffusion
沉默媛9 天前
扩散模型-图像编辑【An Edit Friendly DDPM Noise Space: Inversion and Manipulations】
人工智能·计算机视觉·cvpr·扩散模型·图像编辑·ddpm
_Meilinger_11 天前
碎片笔记|生成模型原理解读:AutoEncoder、GAN 与扩散模型图像生成机制
人工智能·生成对抗网络·gan·扩散模型·图像生成·diffusion model
云澈ovo11 天前
FP16混合精度训练:Stable Diffusion生成速度提升300%的硬件配置方案
人工智能·机器学习·stable diffusion