Stable Diffusion WebUI 生成参数:高清修复/高分辨率修复(Hires.fix)

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里

大家好,我是水滴~~

在本篇文章中,我们将深入探讨 Stable Diffusion WebUI 的一个引人注目的生成参数------高分辨率修复(Hires.fix)。我们将逐一解析这一功能的要点,包括推荐的绘图分辨率、高分辨率修复的参数设置,以及通过生动的案例演示来展现其实际效果。

希望能对你有所帮助!

文章目录


推荐分辨率

在 Stable Diffusion 的模型中,最常用的是 SD1.5 和 SDXL 两个版本。我们知道,SD1.5 模型是在 512px768px 下进行训练,而 SDXL 是在 1024px 下训练的。所以我们出图时的尺寸尽量不要超过这个分辨率,否则可能会让整体画面失去控制。

比如,下图出现了两个头:

下面是推荐的一些分辨率,可以根据你需要的宽高比例来选择:

SD1.5 模型

  • 1:1(方形):512×512、768×768
  • 3:2(横向):768×512
  • 2:3(纵向):512×768
  • 4:3(横向):768×576
  • 3:4(纵向):576×768
  • 16:9(宽屏):912×512
  • 9:16(高的):512×912
  • 9:20(高的):346×768

SDXL 模型

  • 1:1(方形):1024×1024、768×768
  • 3:2(横向):1152×768
  • 2:3(纵向):768×1152
  • 4:3(横向):1152×864
  • 3:4(纵向):864×1152
  • 16:9(宽屏):1360×768
  • 9:16(高的):768×1360
  • 9:20(高的):512×1138

高分辨率修复

那么我们如何生成更高尺寸的图片呢,这里我们使用的是"高分辨率修复(Hires.fix)":

点击"三角号"可以展开面板:

放大算法

放大算法(Upscaler)是一种用于增强图像分辨率或尺寸的技术。在 Stable Diffusion 中,放大算法旨在将低分辨率的图像无损或尽可能少地损失细节地放大到更高的分辨率。这通常涉及到复杂的数学和机器学习技术,以确保放大后的图像在视觉效果上尽可能接近原始高清图像。

下面列出了18种放大算法:

Plain 复制代码
Latent
Latent (antialiased)
Latent (bicubic)
Latent (bicubic antialiased)
Latent (nearest)
Latent (nearest-exact)
Lanczos
Nearest
DAT x2
DAT x3
DAT x4
ESRGAN_4x
LDSR
R-ESRGAN 4x+
R-ESRGAN 4x+ Anime6B
ScuNET GAN
ScuNET PSNR
SwinIR 4x

这些放大算法各有优缺点,我们不过多介绍,对于新手而言,这里只使用两个即可:

  • R-ESRGAN 4x+ Anime6B:绘制二次元漫画风格时使用。
  • R-ESRGAN 4x+:绘制其它风格时使用。

重设迭代步数

重设迭代步数(Hires steps)为我们进行高清修复时使用的迭代步数,设置为零时则使用默认步数。这个参数一般不需要调整,保持零即可。如果调整也需要配合重绘幅度进行.

重绘幅度

重绘幅度(Denoising strength)在 Stable Diffusion WebUI 中是一个 0~1 的值,值越高重绘幅度越大,也就是与原图的差距就越大。当设为0时,重绘后的图片没有任何变化;当设为1时,重绘后的图片几乎是另一张图。那么我们该如何选择呢?

我们在即保持原图不要有太大变化,又要增强图片的细节,通常这里选择 3~5 之间即可。

放大倍率、将宽度调整到、将高度调整到

放大倍率(Upscale by)指我们希望将原图的尺寸放大多少倍,默认为2。通常我们放大两倍即可,更高的倍数也更吃显存。

将宽度调整到(Resize width to)、将高度调整到(Resize height to)可以让我们自定义宽度和高度,它们不可以与放大倍率同时使用。

案例演示

下面将演示生成手机壁纸的过程:先使用低分辨率生成多张原图,然后选择满意的图片进行高清修复。

下面案例中,先生成了一张1K的图,然后生成了一张2K的图,可以对比看下效果。

生成参数

模型:DreamShaper(梦想塑造者)

分辨率:346×768

提示词:

Plain 复制代码
masterpiece, best quality, 1girl, (colorful),(delicate eyes and face), volumatic light, ray tracing, bust shot ,extremely detailed CG unity 8k wallpaper,solo,smile,intricate skirt,((flying petal)),(Flowery meadow) sky, cloudy_sky, moonlight, moon, night, (dark theme:1.3), light, fantasy, windy, magic sparks, dark castle,white hair

负面提示词:

Plain 复制代码
paintings, sketches, fingers, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), backlight,(ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (more than 2 nipples:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit, (futa:1.1),bad hands, missing fingers, bad-hands-5

生成批次:9

其它参数:默认

生成原图(抽卡)

先用低分辨率(346×768)生成 9 张图片,将这些图片做为原图。这个过程很多人叫做"抽卡"。

我们可以从这 9 张图片中选择一个满意的图片,然后进行高清修复。

高清修复(1K)

首先在图片预览区选中要高清修复的原图,点击"绿色循环"图标来获取随机种子,这时【随机种子】框中内容会变成该图的随机种子。

选中的原图:

然后选中【高分辨率修复】,放大算法选择【R-ESRGAN 4x+】,【重绘幅度】设为 0.4,【放大倍数】设为 2,表示放大两倍。(注意:生成批次别忘了改回 1)

设置好后点击【生成】按钮:

生成的图片像素为 692×1536,约为1K:

高清修复(2K)

效果还可以,我们再增加些尺寸,这次直接将宽度设为 1024,然后点击【生成】按钮:

生成的图片像素为 1024×2272,约为2K:

可以看出,生成的图片越来越清晰、细腻。

相关推荐
Learn-Python13 小时前
MongoDB-only方法
python·sql
小途软件14 小时前
用于机器人电池电量预测的Sarsa强化学习混合集成方法
java·人工智能·pytorch·python·深度学习·语言模型
墨风如雪14 小时前
阿里Qwen3-VL双子星开源:图文视频混合检索的“降维打击”
aigc
扫地的小何尚14 小时前
NVIDIA RTX PC开源AI工具升级:加速LLM和扩散模型的性能革命
人工智能·python·算法·开源·nvidia·1024程序员节
wanglei20070815 小时前
生产者消费者
开发语言·python
清水白石00815 小时前
《从零到进阶:Pydantic v1 与 v2 的核心差异与零成本校验实现原理》
数据库·python
昵称已被吞噬~‘(*@﹏@*)’~15 小时前
【RL+空战】学习记录03:基于JSBSim构造简易空空导弹模型,并结合python接口调用测试
开发语言·人工智能·python·学习·深度强化学习·jsbsim·空战
2501_9418779816 小时前
从配置热更新到运行时自适应的互联网工程语法演进与多语言实践随笔分享
开发语言·前端·python
酩酊仙人16 小时前
fastmcp构建mcp server和client
python·ai·mcp
且去填词16 小时前
DeepSeek API 深度解析:从流式输出、Function Calling 到构建拥有“手脚”的 AI 应用
人工智能·python·语言模型·llm·agent·deepseek