Stable Diffusion WebUI Forge 是 Stable Diffusion WebUI(基于 Gradio)之上的平台,可简化开发、优化资源管理并加快推理速度。"Forge"这个名字的灵感来自"Minecraft Forge"。这个项目旨在成为SD WebUI的Forge。
与原始 WebUI(用于 1024px 的 SDXL 推理)相比,您可以期待以下加速:
1、如果您使用 8GB vram 等普通 GPU,您可以期望在推理速度 (it/s) 方面获得大约 30~45% 的速度,GPU 内存峰值(在任务管理器中)将下降约 700MB 至 1.3GB,最大扩散分辨率(不会 OOM)将增加约 2 倍到 3 倍,最大扩散批大小(不会 OOM)将增加约 4 倍到 6 倍。
2、如果您使用功能较弱的 GPU,例如 6GB vram,您可以期望在推理速度 (it/s) 方面获得大约 60~75% 的速度,GPU 内存峰值(在任务管理器中)将下降约 800MB 至 1.5GB,最大扩散分辨率(不会 OOM)将增加约 3 倍,最大扩散批大小(不会 OOM)将增加约 4 倍。
3、如果您使用具有 24GB vram 的 4090 等强大的 GPU,您可以期望推理速度(it/s)提高约 3~6%,GPU 内存峰值(在任务管理器中)将下降约 1GB 至 1.4GB,最大扩散分辨率(不会 OOM)将增加约 1.6 倍,最大扩散批大小(不会 OOM)将增加约 2 倍。
4、如果使用 ControlNet for SDXL,最大 ControlNet 计数(不会 OOM)将增加约 2 倍,使用 SDXL+ControlNet 的速度将加快约 30~45%。
Forge 带来的另一个非常重要的变化是 Unet Patcher。使用 Unet Patcher,Self-Attention Guidance、Kohya High Res Fix、FreeU、StyleAlign、Hypertile 等方法都可以在大约 100 行代码中实现。
项目地址:GitHub - lllyasviel/stable-diffusion-webui-forge
一:安装Forge
下载后解压放在win11的某个目录下,我自己是放在D:\APP\webui_forge_cu121_torch21
可以根据自己硬盘的实际情况放置到你想安装的地方。
二:环境准备
1、需要Nvidia显卡,Vram至少6G
2、安装Nvidia驱动。
3、安装cuda
4、安装VC2019
5、安装cuDNN
详细过程请参考此篇文章中win11的准备工作:
在Win11上部署ChatGLM2-6B详细步骤--(上)准备工作_win11 chatglm-CSDN博客
三:升级及运行软件
运行升级脚 本:
update.bat
如果网络不允许也可以省略此部,不过强烈见意执行升级程序。
运行软件
run.bat
可以双击run.bat
一键安装包里面包含了部分模型,其他模型你使用过程中还需要单独下载。据说Forge可以运行在4GBvram的SDXL和2GB vram的SD1.5上,因条件限制还没有测试,有条件的小伙伴可以试试看。