第二十节.探索新技术:如何自学SD3模型(上)(找官方资料/精读/下载/安装/3款工作流/效果测试)

早在 2024 年 6 月 12 日,StabilityAI 开源了最新的 SD3 模型的 2B 版本,而神奇的是,ComfyUI 早在 6 月 11 号就已经适配了 SD3!相比之下,SD WebUI 的更新速度却远远落后...

所以,如果想要尝试一些 AI 绘画领域的新技术,ComfyUI 是一个非常值得投入时间学习的工具。

这节课,我们就来讲一下 SD3 这个模型,以及官方开源的一堆内容,到底是做什么的?


🍉模型下载

首先是模型下载

1. 去哪里下载?

想要找官方模型,一般都去抱脸(huggingface) 找,网址(需要魔法):https://huggingface.co

2.怎么才能找到想要的模型呢?

3.怎么下载?

  • 点击顶部的"Files and Versions",可以看到本次开源的模型及相关资料

备注 :此模型的官方 StabilityAI 要求填写必要的个人信息 ,才可以下载(大部分模型是不需要的)。所以,在下载前,需要先自行填写信息注册并登录才可以看到 上面的完整的下载页面

  • 待看到完整的模型界面后,就可以通过点击模型右侧的下载图标,来下载该模型了(点击后,直接通过浏览器下载):
  • 如果网络不好,也可以从以下网盘下载模型及工作流:下载地址:

夸克网盘分享https://pan.quark.cn/s/5cc3824dd3b9#/list/share

这么多内容,是不是都需要下载呢?

我们继续往下看,这些模型分别是什么 ?这几个大模型,有什么不一样

🍉模型介绍

1. 官方说明

一般模型的介绍,还是建议大家看原作者的说明,网络上有很多二次分享的 UP 主,介绍的不一定有官方全面。

官方的这一段说明,其实已经介绍的比较详细了,先大概翻译下:

  • 这次的 SD3 模型 ,其实是比较大的,并且使用了 3 个 text encoder 编码器 ,分别是:clip_gclip_l ,和 t5xxl ,也就是 text_encoders 文件夹下的这些文件。

注意 :你会发现 t5xxl 有两个版本 ,分别是fp16 版本和 fp8 版本 ,这两个版本虽然体积相差一倍 ,但是实际效果差别不大 ,所以建议 直接使用fp8 版本就可以,比较省硬盘空间。

相关推荐
绝世这天下21 小时前
【在 DGX Spark 上运行 vLLM-Omni 用于 Qwen3-TTS(语音设计,语音克隆)】
人工智能
陈大鱼头1 天前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模1 天前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
幂律智能1 天前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤1 天前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人1 天前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点1 天前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化
如若1231 天前
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
人工智能·pytorch·python
七牛云行业应用1 天前
GPT-5.4能力前瞻:解析原生电脑操控(Computer Use)原理与Agent架构构建
人工智能·chatgpt·大语言模型·ai agent·mcp协议
带娃的IT创业者1 天前
Prompt Engineering 进阶:让 AI 写出人类味道(完整指南)
人工智能·大模型·llm·prompt·写作技巧·ai 教学