推荐一个stable-diffusion-webui的升级项目stable-diffusion-webui-forge

如果你习惯本地部署stable-diffusion-webui的话,也可以考虑部署一下stable-diffusion-webui-forge。个人试验了一下,在mac上比早期的sd安装容易了很多。基本一个命令就搞定了,而且forge在cmd不需要加入太多的参数。

github地址

下面是官方的一些简介翻译:

markdown 复制代码
# Stable Diffusion WebUI Forge
Stable Diffusion WebUI Forge 是建立在 Stable Diffusion WebUI (基于 Gradio) 之上的平台,旨在简化开发,优化资源管理,并加快推理速度。
"Forge"这个名字的灵感来自"Minecraft Forge"。这个项目的目标是成为 SD WebUI 的 Forge。

与原始 WebUI (用于 SDXL 推理,分辨率为 1024px) 相比,您可以期待以下加速效果:

- 如果您使用的是常见的 GPU,如 8GB vram,您可以预期推理速度 (it/s) 提高约 30~45%,GPU 内存峰值 (任务管理器中) 将下降约 700MB 至 1.3GB,最大扩散分辨率 (不会 OOM) 将增加约 2 倍至 3 倍,最大扩散批量大小 (不会 OOM) 将增加约 4 倍至 6 倍。
- 如果您使用的是 6GB vram 的不太强大的 GPU,您可以预期推理速度 (it/s) 提高约 60~75%,GPU 内存峰值 (任务管理器中) 将下降约 800MB 至 1.5GB,最大扩散分辨率 (不会 OOM) 将增加约 3 倍,最大扩散批量大小 (不会 OOM) 将增加约 4 倍。
- 如果您使用的是强大的 GPU,如 4090 带有 24GB vram,您可以预期推理速度 (it/s) 提高约 3~6%,GPU 内存峰值 (任务管理器中) 将下降约 1GB 至 1.4GB,最大扩散分辨率 (不会 OOM) 将增加约 1.6 倍,最大扩散批量大小 (不会 OOM) 将增加约 2 倍。

如果您使用 ControlNet 进行 SDXL,最大 ControlNet 计数 (不会 OOM) 将增加约 2 倍,SDXL+ControlNet 的速度将加快约 30~45%。

Forge 带来的另一个非常重要的变化是 Unet Patcher。使用 Unet Patcher,像 Self-Attention Guidance、Kohya High Res Fix、FreeU、StyleAlign、Hypertile 等方法都可以在大约 100 行代码中实现。

感谢 Unet Patcher,Forge 现在支持许多新功能,包括 SVD、Z123、masked Ip-adapter、masked controlnet、photomaker 等。

不再需要 monkeypatch UNet 并与其他扩展冲突了!

Forge 还增加了几个采样器,包括但不限于 DDPM、DDPM Karras、DPM++ 2M Turbo、DPM++ 2M SDE Turbo、LCM Karras、Euler A Turbo 等。(LCM 自 1.7.0 起已在原始 webui 中)

最后,Forge 承诺我们只会做我们的工作。Forge 永远不会对用户界面添加不必要的主观更改。您仍然使用的是 100% 自动化的 WebUI。

## 安装 Forge

如果您精通 Git 并且想要将 Forge 作为 SD-WebUI 的另一个分支进行安装,请参考此处。通过这种方式,您可以重用所有 SD 检查点以及您之前在 OG SD-WebUI 中安装的所有扩展,但您应该清楚自己在做什么。

如果您知道自己在做什么,您可以使用与 SD-WebUI 相同的方法安装 Forge。(安装 Git、Python、Git Clone 仓库 https://github.com/lllyasviel/stable-diffusion-webui-forge.git,然后运行 webui-user.bat)。

或者,您可以直接使用这个一键安装包(包含 git 和 python)。

> [点击此处下载一键安装包](https://github.com/lllyasviel/stable-diffusion-webui-forge)

下载后,您解压缩,使用 update.bat 更新,使用 run.bat 运行。

请注意运行 update.bat 很重要,否则您可能使用的是带有未修复潜在错误的先前版本。

## 对比截图

我在几台设备上进行了测试,这是来自 8GB VRAM (3070ti 笔记本) 使用 SDXL 的典型结果。

这是原始的 WebUI:
(平均约 7.4GB/8GB,峰值约为 7.9GB/8GB)

这是 WebUI Forge:
(平均和峰值都是 6.3GB/8GB)

您可以看到 Forge 没有改变 WebUI 的结果。安装 Forge 不是一个破坏种子的变化。

Forge 可以完美地保持 WebUI 不变,即使是对于最复杂的提示,如带有 [mountain:lake:0.25] 和 [an oak:a christmas tree:0.75][ in foreground::0.6][ in background:0.25] [shoddy:masterful:0.5] 的奇幻风景。

您之前的所有作品在 Forge 中仍然有效!

## Forge 后端

Forge 后端移除了所有与资源管理相关的 WebUI 代码,并重新构建了一切。所有之前的 CMD 标志,如 medvram、lowvram、medvram-sdxl、precision full、no half、no half vae、attention_xxx、upcast unet 等都被移除了。添加这些标志不会引起错误,但它们现在不会做任何事情。我们强烈鼓励 Forge 用户移除所有 cmd 标志,让 Forge 决定如何加载模型。

没有任何 cmd 标志,Forge 可以运行 SDXL 需要 4GB vram,SD1.5 需要 2GB vram。```
相关推荐
空白诗2 天前
CANN ops-nn 算子解读:Stable Diffusion 图像生成中的 Conv2D 卷积实现
深度学习·计算机视觉·stable diffusion
学易2 天前
第十五节.别人的工作流,如何使用和调试(上)?(2类必现报错/缺失节点/缺失模型/思路/实操/通用调试步骤)
人工智能·ai作画·stable diffusion·报错·comfyui·缺失节点
心疼你的一切2 天前
基于CANN仓库算力手把手实现Stable Diffusion图像生成(附完整代码+流程图)
数据仓库·深度学习·stable diffusion·aigc·流程图·cann
Niuguangshuo3 天前
DALL-E 3:如何通过重构“文本描述“革新图像生成
人工智能·深度学习·计算机视觉·stable diffusion·重构·transformer
Niuguangshuo3 天前
深入解析 Stable Diffusion XL(SDXL):改进潜在扩散模型,高分辨率合成突破
stable diffusion
Niuguangshuo3 天前
深入解析Stable Diffusion基石——潜在扩散模型(LDMs)
人工智能·计算机视觉·stable diffusion
迈火3 天前
SD - Latent - Interposer:解锁Stable Diffusion潜在空间的创意工具
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
迈火11 天前
Facerestore CF (Code Former):ComfyUI人脸修复的卓越解决方案
人工智能·gpt·计算机视觉·stable diffusion·aigc·语音识别·midjourney
重启编程之路12 天前
Stable Diffusion 参数记录
stable diffusion
孤狼warrior15 天前
图像生成 Stable Diffusion模型架构介绍及使用代码 附数据集批量获取
人工智能·python·深度学习·stable diffusion·cnn·transformer·stablediffusion