推荐一个stable-diffusion-webui的升级项目stable-diffusion-webui-forge

如果你习惯本地部署stable-diffusion-webui的话，也可以考虑部署一下stable-diffusion-webui-forge。个人试验了一下，在mac上比早期的sd安装容易了很多。基本一个命令就搞定了，而且forge在cmd不需要加入太多的参数。
github地址
下面是官方的一些简介翻译：
markdown 复制代码
# Stable Diffusion WebUI Forge
Stable Diffusion WebUI Forge 是建立在 Stable Diffusion WebUI (基于 Gradio) 之上的平台，旨在简化开发，优化资源管理，并加快推理速度。
"Forge"这个名字的灵感来自"Minecraft Forge"。这个项目的目标是成为 SD WebUI 的 Forge。

与原始 WebUI (用于 SDXL 推理，分辨率为 1024px) 相比，您可以期待以下加速效果：

- 如果您使用的是常见的 GPU，如 8GB vram，您可以预期推理速度 (it/s) 提高约 30~45%，GPU 内存峰值 (任务管理器中) 将下降约 700MB 至 1.3GB，最大扩散分辨率 (不会 OOM) 将增加约 2 倍至 3 倍，最大扩散批量大小 (不会 OOM) 将增加约 4 倍至 6 倍。
- 如果您使用的是 6GB vram 的不太强大的 GPU，您可以预期推理速度 (it/s) 提高约 60~75%，GPU 内存峰值 (任务管理器中) 将下降约 800MB 至 1.5GB，最大扩散分辨率 (不会 OOM) 将增加约 3 倍，最大扩散批量大小 (不会 OOM) 将增加约 4 倍。
- 如果您使用的是强大的 GPU，如 4090 带有 24GB vram，您可以预期推理速度 (it/s) 提高约 3~6%，GPU 内存峰值 (任务管理器中) 将下降约 1GB 至 1.4GB，最大扩散分辨率 (不会 OOM) 将增加约 1.6 倍，最大扩散批量大小 (不会 OOM) 将增加约 2 倍。

如果您使用 ControlNet 进行 SDXL，最大 ControlNet 计数 (不会 OOM) 将增加约 2 倍，SDXL+ControlNet 的速度将加快约 30~45%。

Forge 带来的另一个非常重要的变化是 Unet Patcher。使用 Unet Patcher，像 Self-Attention Guidance、Kohya High Res Fix、FreeU、StyleAlign、Hypertile 等方法都可以在大约 100 行代码中实现。

感谢 Unet Patcher，Forge 现在支持许多新功能，包括 SVD、Z123、masked Ip-adapter、masked controlnet、photomaker 等。

不再需要 monkeypatch UNet 并与其他扩展冲突了！

Forge 还增加了几个采样器，包括但不限于 DDPM、DDPM Karras、DPM++ 2M Turbo、DPM++ 2M SDE Turbo、LCM Karras、Euler A Turbo 等。(LCM 自 1.7.0 起已在原始 webui 中)

最后，Forge 承诺我们只会做我们的工作。Forge 永远不会对用户界面添加不必要的主观更改。您仍然使用的是 100% 自动化的 WebUI。

## 安装 Forge

如果您精通 Git 并且想要将 Forge 作为 SD-WebUI 的另一个分支进行安装，请参考此处。通过这种方式，您可以重用所有 SD 检查点以及您之前在 OG SD-WebUI 中安装的所有扩展，但您应该清楚自己在做什么。

如果您知道自己在做什么，您可以使用与 SD-WebUI 相同的方法安装 Forge。（安装 Git、Python、Git Clone 仓库 https://github.com/lllyasviel/stable-diffusion-webui-forge.git，然后运行 webui-user.bat）。

或者，您可以直接使用这个一键安装包（包含 git 和 python）。

> [点击此处下载一键安装包](https://github.com/lllyasviel/stable-diffusion-webui-forge)

下载后，您解压缩，使用 update.bat 更新，使用 run.bat 运行。

请注意运行 update.bat 很重要，否则您可能使用的是带有未修复潜在错误的先前版本。

## 对比截图

我在几台设备上进行了测试，这是来自 8GB VRAM (3070ti 笔记本) 使用 SDXL 的典型结果。

这是原始的 WebUI：
(平均约 7.4GB/8GB，峰值约为 7.9GB/8GB)

这是 WebUI Forge：
(平均和峰值都是 6.3GB/8GB)

您可以看到 Forge 没有改变 WebUI 的结果。安装 Forge 不是一个破坏种子的变化。

Forge 可以完美地保持 WebUI 不变，即使是对于最复杂的提示，如带有 [mountain:lake:0.25] 和 [an oak:a christmas tree:0.75][ in foreground::0.6][ in background:0.25] [shoddy:masterful:0.5] 的奇幻风景。

您之前的所有作品在 Forge 中仍然有效！

## Forge 后端

Forge 后端移除了所有与资源管理相关的 WebUI 代码，并重新构建了一切。所有之前的 CMD 标志，如 medvram、lowvram、medvram-sdxl、precision full、no half、no half vae、attention_xxx、upcast unet 等都被移除了。添加这些标志不会引起错误，但它们现在不会做任何事情。我们强烈鼓励 Forge 用户移除所有 cmd 标志，让 Forge 决定如何加载模型。

没有任何 cmd 标志，Forge 可以运行 SDXL 需要 4GB vram，SD1.5 需要 2GB vram。```