第二十节.探索新技术:如何自学SD3模型(上)(找官方资料/精读/下载/安装/3款工作流/效果测试)

早在 2024 年 6 月 12 日,StabilityAI 开源了最新的 SD3 模型的 2B 版本,而神奇的是,ComfyUI 早在 6 月 11 号就已经适配了 SD3!相比之下,SD WebUI 的更新速度却远远落后...

所以,如果想要尝试一些 AI 绘画领域的新技术,ComfyUI 是一个非常值得投入时间学习的工具。

这节课,我们就来讲一下 SD3 这个模型,以及官方开源的一堆内容,到底是做什么的?


🍉模型下载

首先是模型下载

1. 去哪里下载?

想要找官方模型,一般都去抱脸(huggingface) 找,网址(需要魔法):https://huggingface.co

2.怎么才能找到想要的模型呢?

3.怎么下载?

  • 点击顶部的"Files and Versions",可以看到本次开源的模型及相关资料

备注 :此模型的官方 StabilityAI 要求填写必要的个人信息 ,才可以下载(大部分模型是不需要的)。所以,在下载前,需要先自行填写信息注册并登录才可以看到 上面的完整的下载页面

  • 待看到完整的模型界面后,就可以通过点击模型右侧的下载图标,来下载该模型了(点击后,直接通过浏览器下载):
  • 如果网络不好,也可以从以下网盘下载模型及工作流:下载地址:

夸克网盘分享https://pan.quark.cn/s/5cc3824dd3b9#/list/share

这么多内容,是不是都需要下载呢?

我们继续往下看,这些模型分别是什么 ?这几个大模型,有什么不一样

🍉模型介绍

1. 官方说明

一般模型的介绍,还是建议大家看原作者的说明,网络上有很多二次分享的 UP 主,介绍的不一定有官方全面。

官方的这一段说明,其实已经介绍的比较详细了,先大概翻译下:

  • 这次的 SD3 模型 ,其实是比较大的,并且使用了 3 个 text encoder 编码器 ,分别是:clip_gclip_l ,和 t5xxl ,也就是 text_encoders 文件夹下的这些文件。

注意 :你会发现 t5xxl 有两个版本 ,分别是fp16 版本和 fp8 版本 ,这两个版本虽然体积相差一倍 ,但是实际效果差别不大 ,所以建议 直接使用fp8 版本就可以,比较省硬盘空间。

相关推荐
声光界1 分钟前
《声音与音乐中的情感理解及人机交互设计》
人工智能·人机交互·声学
voidmort3 分钟前
13. 强化学习中的评估、奖励设计与 Reward Hacking
人工智能
Studying 开龙wu4 分钟前
16位工业灰度图的深度学习预处理:从方法选择到ImageJ实战
人工智能·深度学习
烟雨江南7858 分钟前
特高压输电线路带电作业直升机吊篮与强电磁感应放电:基于“灵声智库”空间自适应滤波与声纹授权的离线语音控制指令方案
人工智能·ffmpeg·webrtc·语音识别·ai质检
清辞85310 分钟前
入门大模型工程师第十课----学习总结
大数据·人工智能·深度学习·学习·语言模型
zhangfeng113310 分钟前
那nvidia orim车载gpu tee安全飞地 和天垓 100 gpgpu的 飞地 ,大概有多大存储量 ,解密流程
人工智能·深度学习·安全·语言模型·gpu算力·芯片
蔡不菜和他的uU们24 分钟前
vLLM实践之个人AI基建——云端vLLM+SSH Tunnel+本地Cherry Studio
人工智能·ssh·vllm
黄啊码29 分钟前
8个AI,同一道高考作文题,同一个结果:我的那篇最好
人工智能
m0_7372469830 分钟前
QDKT产品拆解&设计
人工智能
xinlianyq33 分钟前
TikTok短视频生成工具哪家好?跨境出海如何用 AI 实现爆款视频复刻
人工智能·aigc