【AI绘画】Stable Diffusion 3开源

Open Release of Stable Diffusion 3 Medium

主要内容

Stable Diffusion 3是Stability AI目前为止最先进的文本转图像开放源代码算法。

这款模型的小巧设计使其完美适合用于消费级PC和笔记本电脑,以及企业级图形处理单元上运行。它已经满足了标准化的文字转图像模型所需要的一切条件,适应市场需求的下一代模型正在到来。

基于 Stable Diffusion 模型,参数数量为20亿的SD3 大型模型,该模型具有诸多显著特点:

总体质量和摄影实效 :采用先进的图像处理技术,能够生成精确、色彩饱和且光线自然的图像,同时也可以制作出高品质且多样化风格的输出。利用如16 通道 VAE的创新性技术解决了其他模型经常会遇到的问题,例如手部和面部实体效果不足等问题。

快速理解功能 :可以识别且正确处理长度较大、复杂性较高的交互式输入,包括空间思维、组合元素、动作和风格。使用三种或更多的文本编码器,可以为用户提供性能与效率之间的取舍。

字体:利用我们的扩增式变换器结构,大幅降低读写错误、调整空白间隙、书写形成字符和搭配笔画方面的失误。实现了前所未有的文本清晰度,并使输出效果更准确丝滑。

资源效率高 :它能够在消费者级的GPU上运行而不会导致性能下降,因为它使用了少量视频内存。

微调优化 :可以从小数据集上吸收额外细节,这是一种非常完美的个性定制方法。

与NVIDIA的合作

我们与Nvidia合作,使用其TensorRT技术为稳定概率模型系列产品中的所有版本提高了性能。包括Stable Diffusion 3 Medium在内的所有版本都利用Nvidia® RTX™ GPU和TensorRT™技术,使其在性能方面表现得更好。通过这种方式我们将能够获得最佳性能,并提高50%的性能水平。

下载优化 TensorRT 的Stable Diffusion 3 Medium :https://huggingface.co/stabilityai/stable-diffusion-3-medium-tensorrt。

与AMD的合作

英特尔已对SD3 Medium进行了优化,以匹配包括英特尔最新一代APU、消费级GPU和MI-300X Enterprise Gpu在内的多种AMD设备。

如何启动该程序

下载 Stable Diffusion 3 Medium 绘图的权重:https://huggingface.co/stabilityai/stable-diffusion-3-medium

Diffusers运行:

复制代码
import torch
from diffusers import StableDiffusion3Pipeline

pipe = StableDiffusion3Pipeline.from_pretrained("stabilityai/stable-diffusion-3-medium-diffusers", torch_dtype=torch.float16)
pipe = pipe.to("cuda")

image = pipe(
    "A cat holding a sign that says hello world",
    negative_prompt="",
    num_inference_steps=28,
    guidance_scale=7.0,
).images[0]
image
相关推荐
yy我不解释1 小时前
关于comfyui的mmaudio音频生成插件时时间不一致问题(三)
开发语言·python·ai作画·音视频·comfyui
yy我不解释7 小时前
关于comfyui的mmaudio音频生成插件时时间不一致问题(四)(video upload)(解决方法)
开发语言·python·ai作画·音视频·comfyui
柯儿的天空8 小时前
【OpenClaw 全面解析:从零到精通】第 021 篇:Claw 家族全景——从桌面级到边缘部署的轻量级智能体变体深度解析
gpt·ai作画·自动化·aigc·ai编程·ai写作·agi
Shining05969 小时前
AI 编译器系列(六)《Stable Diffusion 在 InfiniTensor 推理框架中的适配与工程实践》
人工智能·算法·stable diffusion·大模型·图像生成·ai编译器·infinitensor
柯儿的天空1 天前
【OpenClaw 全面解析:从零到精通】第 013 篇:OpenClaw 安全机制深度解析——沙盒隔离、权限控制与安全最佳实践
人工智能·安全·ai作画·aigc·ai写作
柯儿的天空1 天前
【OpenClaw 全面解析:从零到精通】第 016 篇:OpenClaw 实战案例——代码开发助手,从代码生成到部署自动化的全流程
运维·人工智能·ai作画·自动化·aigc·ai写作
柯儿的天空1 天前
【OpenClaw 全面解析:从零到精通】第 015 篇:OpenClaw 实战案例——自动化办公助手,邮件、日历、文件管理一站式解决方案
运维·人工智能·ai作画·自动化·aigc·ai写作
柯儿的天空1 天前
【OpenClaw 全面解析:从零到精通】第003篇:OpenClaw 技术依赖与生态栈详解
人工智能·ai作画·腾讯云ai代码助手
柯儿的天空2 天前
【OpenClaw 全面解析:从零到精通】第 006 篇:OpenClaw 在 Windows/WSL2 上的安装与部署实战
人工智能·windows·语言模型·chatgpt·ai作画
柯儿的天空2 天前
【OpenClaw 全面解析:从零到精通】第 005 篇:OpenClaw 在 macOS 上的安装与部署实战
人工智能·macos·自然语言处理·ai作画