Stable diffusion 3.0

Esser P, Kulal S, Blattmann A, et al. Scaling rectified flow transformers for high-resolution image synthesis[C]//Forty-first International Conference on Machine Learning. 2024.

https://github.com/huggingface/diffusers/releases/tag/v0.29.0

https://huggingface.co/stabilityai/stable-diffusion-3-medium-diffusers

https://huggingface.co/docs/diffusers/main/en/api/pipelines/stable_diffusion/stable_diffusion_3

实验过程

  1. 安装依赖:

    bash 复制代码
    pip install -U diffusers
    pip install transformers
    pip install sentencepiece
  2. 在 huggingface 上申请 SD3 并创建 Token,然后在终端进行登录:

  3. 随后就可以使用 demo 进行推理,第一次下载模型较慢,以后每次调用可以直接加载模型进行推理:

    需要注意的是,预训练模型会下载到 cache 文件夹下,如果想要更改位置,可以提前设置 HF_HOMEHUGGINFACE_HUB_CACHE 环境变量 [1](#1)

实验结果

a photo of an astronaut riding a horse on mars:

a photo of a Lamborghini racing on the track:

a photo of the night scenery of Chongqing:

a photo of the Great Wall:

A poster of Ferrari:

A wallpaper of NBA stars:


  1. Diffusers ↩︎
相关推荐
m0_650108242 天前
【论文精读】AVID:基于扩散模型的任意长度视频修复
人工智能·扩散模型·论文精读·视频修复·时序一致性·任意时长·结构引导
Coovally AI模型快速验证2 天前
未来已来:从 CVPR & ICCV 观察 2025→2026 年计算机视觉的七大走向
人工智能·深度学习·目标检测·计算机视觉·stable diffusion
Brianna Home4 天前
大模型如何变身金融风控专家
人工智能·深度学习·机器学习·自然语言处理·stable diffusion·1024程序员节
m0_650108244 天前
【论文精读】DreamVideo:定制化主体与动作的视频生成技术
扩散模型·论文精读·定制化视频生成·主体学习与动作学习·轻量级适配器·文本引导生成·阿里千问实验室
m0_650108244 天前
【论文精读】EMO:弱条件下基于 Audio2Video 扩散模型的表情肖像视频生成
aigc·扩散模型·论文精读·音频到视频生成·会说话的头部·弱条件
leafff1234 天前
新手入坑 Stable Diffusion:模型、LoRA、硬件一篇讲透
人工智能·计算机视觉·stable diffusion
m0_650108246 天前
【论文精读】MicroCinema:基于分治策略的文本到视频生成新框架
aigc·扩散模型·论文精读·分治策略·文本到视频生成
m0_650108246 天前
【论文精读】Snap Video:面向文本到视频生成的规模化时空 Transformer
aigc·扩散模型·论文精读·时空transformer·文本到视频生成·视频生成效率优化
Small___ming7 天前
【论文笔记】扩散模型——如何通俗理解传统概率模型的核心矛盾
论文阅读·人工智能·扩散模型·生成式人工智能
m0_650108247 天前
【论文精读】TI2V-Zero:零样本图像引导的文本到视频生成技术
计算机视觉·扩散模型·零样本学习·论文精读·文本条件图像到视频生成