Stable Diffusion AIGC 视觉设计实战教程之 08-高级图像处理

高清放大

高分辨率修复

Stable Diffusion 文生图的高分辨率修复（Hires.fix）核心采用低分辨率打底 + 高分辨率重绘的两阶段流程，既能提升分辨率，又能保证构图与细节，是解决大尺寸生成模糊、细节不足等问题的方案。

高分辨率修复分两步完成高清化：

第一阶段：按设定的低分辨率生成基础图，确保构图准确。
第二阶段：将基础图通过放大算法提升至目标分辨率，再添加适量噪声后，用扩散模型去噪重绘，补充细节并修正失真，最终输出高清图。

高分辨率修复的核心参数：

放大算法：决定低分辨率图放大到高分辨率时的像素重建逻辑，直接影响细节精度与风格匹配度。
放大倍率：从基础低分辨率图到最终高分辨率图的缩放比例（等比缩放），低显存优先选择 1.5～2.0 倍，生成超大幅图不建议单次使用高倍率。
将宽度/高度调整到：手动指定缩放的宽度和高度。
重绘幅度：控制高分辨率修复第二阶段去噪重绘的幅度，取值范围为 0～1，0 即完全不重绘仅简单放大，1 即完全抛弃原图重新生成高分辨率图，0.3～0.5 能保留 90%+ 原构图，新增中等细节（如皮肤纹理、毛发等），适合绝大多数场景。重绘幅度尽可能不要超过 0.6，避免出现变形风险。
重绘采样步数：控制高分辨率修复第二阶段去噪重绘的步数，推荐取值范围为基础迭代步数的 2/3。

高分辨率修复常用的放大算法：

R-ESRGAN 4x+：通用型算法，细节锐化强，修复模糊边缘效果好，适合照片、写实插画、风景图等高清放大，但过度锐化易产生塑料感。
R-ESRGAN 4x+ Anime6B：针对二次元优化，线条更流畅，色彩更鲜艳，适合动漫、漫画、二次元角色图等高清放大，用于写实图高清放大时容易失真。
SwinIR 4x：细节还原细腻，保留纹理自然度（如皮肤、布料等），适合人像、写实摄影、高精度插画等高清放大，但生成速度较慢，对模糊图修复力弱。
Latent：潜空间放大，在画面放大的同时不会增加画面细节，但整体比较柔和，适合所有场景。
4x_NMKD-Superscale：平衡细节与自然度，对低清图修复效果突出，适合老照片修复、低分辨率素材重绘，但生成时间较长。
Lanczos：轻量、快速且风格中性的图像放大算法，低失真、无过度锐化，适合作为主算法快速预览，或作为辅算法修正其他强锐化算法的缺陷。

以生成一张人物写实图为例，参考生成参数如下。

ckpt 检查点模型：麦橘超然 majicFlus
正向提示词（中文）：一个女孩，独自一人，从下方视角，樱花，户外，棕色头发，白天，衬衫，写实风格，天空，棕色眼睛，蓝天，模糊，粉色衬衫，嘴唇，微张的嘴唇，条纹衬衫，上半身，向下看，条纹，树
正向提示词（英文）：1girl, solo, from below, cherry blossoms, outdoors, brown hair, day, shirt, realistic, sky, brown eyes, blue sky, blurry, pink shirt, lips, parted lips, striped shirt, upper body, looking down, striped, tree
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler a
迭代步数：20
提示词引导系数：7
图片尺寸：512x512

生成效果：

调整生成参数如下。

随机数种子：955073264
高分辨率修复：开启
放大算法：R-ESRGAN 4x+
放大倍率：3（512x512～1536x1536）
放大重绘幅度：0.3

生成效果：

后期处理附加功能放大

Stable Diffusion 中的附加功能后期处理，也为创作者提供了丰富的图片处理选项，创作者也可以使用附加功能后期处理实现高清放大。

后期处理附加功能放大允许用户自己上传自己的图片，并直接提高图片的分辨率，不会对原图进行任何形式的重绘和修改，而是直接对图片的分辨率进行提升。

后期处理附加功能高清放大的核心参数：

放大倍率、将宽度/高度调整到：调整放大的尺寸/倍率。
放大算法：支持 Upscaler1（主算法）、Upscaler2（可选辅助算法），主算法 + 辅助算法结合可以在一定程度上避免单算法的锐化过度、油光或细节不足等问题。
Upscaler 2 可见度：用来调节辅算法与主算法的混合比例。取值范围为 0～1，数值越小，主算法的效果占比越高，数值越接近 1，辅助算法的效果占比越高。
GFPGAN 可见度：针对模糊、变形、低清人脸的修复算法，能快速改善严重失真的人脸，但修复过度时容易出现塑料感或面部细节丢失。取值范围为 0～1，数值越大，对应的人脸修复算法效果越明显，数值越小，则越贴近原图的人脸质感，修复效果越弱。
CodeFormer 可见度：更精细的人脸修复算法，修复效果更自然，对皮肤纹理、五官细节的保留更好，塑料感远低于 GFPGAN，适合对人脸真实度要求高的场景。

下图原始尺寸为 512x512。

以上图为例进行后期处理附加功能放大，参考生成参数如下。

放大倍率：4（512x512～2048x2048）
Upscaler1：R-ESRGAN_4x+
Upscaler2：Lanczos
Upscaler 2 可见度：0.3
CodeFormer 可见度：0.8

生成效果：

图生图直接放大

在 Stable Diffusion 中，高清放大图像还可以借助图生图功能设置图像的分辨率和重绘幅度等参数来实现，但此方法也有尺寸上限的局限性，当分辨率过大时可能会导致无法生图等问题。

SD Upscale

SD Upscale 插件是 Stable Diffusion 的专用放大脚本，是早期实现超分放大的标准化工具，在一些本地部署的 Stable Diffusion 中可以使用该内置插件实现高清放大。

SD Upscale 的核心原理是将原图切割成一个个图块，针对每一个图块分别进行高清修复，完成修复后再将这些图块重新拼接，最终得到放大且高清的图像。

在这个过程中，分块重叠像素宽度扮演着关键角色，其本质是为了避免拼接痕迹，提升图像的整体连贯性。由于每个图块在修复时是独立进行的，如果图块之间没有重叠部分，直接拼接可能会在接缝处出现明显的色差、纹理不连续等问题。

设置分块重叠像素宽度后，在修复过程中，这部分重叠区域会被重复处理，模型会综合考虑相邻图块的信息，对重叠部分进行融合优化。当完成所有图块的修复和拼接后，重叠区域经过处理，使得图像过渡自然，大幅减少了拼接产生的违和感，最终呈现出视觉效果更好的放大图像。

Ultimate SD Upscale

Ultimate SD Upscale（USD）是 SD Upscale 的进阶扩展插件，核心优势在于更强的细节控制、无缝拼接与显存适配，适合高倍数、超高清放大、精细细节修复。

Ultimate SD Upscale 插件的安装与使用：https://github.com/Coyote-A/ultimate-upscale-for-automatic1111

Tiled Diffusion

Tiled Diffusion 是 Stable Diffusion 的高分辨率生成专用扩展插件，核心逻辑是将目标尺寸的大图，按规则分割成多个独立小图块，分别执行扩散生成、放大计算，最后通过算法无缝拼接，能以更小的计算成本更稳定地输出超高清图像，速度快、细节完整。

Tiled Diffusion 是由 Tiled Diffusion 插件、Tiled VAE 插件组成，Tiled Diffusion 负责高分辨率图像的分块生成与无缝拼接，Tiled VAE 负责分块编码解码以避免画质崩坏，二者是高分辨率生成的配套组合，在使用时必须同时启用才能兼顾低显存占用与高清画质。

Tiled Diffusion 和 SD Upscale 的核心区别：

Tiled Diffusion 在潜空间分块计算，显存占用极低，而 SD Upscale 在像素空间分步放大 + 重绘，显存压力大。
Tiled Diffusion 主打一步到位生成、放大 8K 级大图，而 SD Upscale 适合中小尺寸分步放大。
Tiled Diffusion 全局一致性强，但参数不当易出拼接缝，而 SD Upscale 无拼接问题，但分步重绘可能有风格断层。

本地部署的 Stable Diffusion 需要自行安装 Tiled Diffusion 插件、Tiled VAE 插件，LiblibAI 已内置该插件，使用时需要注意部分检查点模型不支持使用 Tiled Diffusion 插件。

Tiled Diffusion 的安装与使用：https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111

Tiled Diffusion 的核心参数：

模块	名称	描述	推荐
Tiled Diffusion 通用	方案	Mixture of Diffusers 适合局部重绘 MultiDiffusion 能确保分块内容一致性，生成大图无明显拼接痕	MultiDiffusion
	潜空间分块宽 / 高	用于把超大尺寸图片的运算空间拆成小块分别处理取值范围 = 16 ~ (检查点模型能生成的最大图片尺寸 / 8)	96
	潜空间分块重叠	设置相邻分块的重叠区域，消除拼接缝 MultiDiffusion 方案设置为 32 或 48 Mixture of Diffusers 方案设置为 16 或 32	48
	分块单批数量	指定一次同时处理多少个拆分好的小块，数量越少越省显存、越稳定	1
	分区提示词控制	把图像按潜空间分块划分为多个区域，给每个区域单独写提示词	-
Tiled Diffusion 文生图	覆盖图像尺寸	勾选后按目标分辨率计算分块，可突破原生图片尺寸限制	-
Tiled Diffusion 图生图	保持输入图像大小	控制图生图的输出尺寸是否与原图一致用于修复细节勾选，用于超清放大取消勾选	-
	放大倍数	放大后图片尺寸 = 原图尺寸 x 放大倍数	-
	放大算法	无约束，优先 Lanczos	Lanczos
	噪声反转	高清放大必开，细节修复可选	-
	反转步数	越小越贴近原图，越大创作空间越大	10
	修复程度	数值越大越贴近原图	-
	重铺噪声强度	数值越大，越能增加噪声随机性，生成的细节更丰富数值过高会偏离原图	≤0.6
	重铺噪声大小	数值越大，噪声覆盖的区域越广，越适合优化大场景细节	64
Tiled VAE	编码器分块大小	控制 VAE 编码阶段的分块尺寸，单位为潜空间单位用于降低显存峰值占用，实现大尺寸图像编码建议在 CUDA error: out of memory 报错前尽可能大的设置其值	1024
	解码器分块大小	控制 VAE 解码阶段的分块尺寸，单位为潜空间单位用于匹配编码器分块逻辑，延续显存优化策略	192
	快速编码解码器	启用轻量化编解码算法，开启后速度提升 30%-50%	开启
	快速编码器颜色修复	校准分块色偏，优先开启	开启

以生成一张人物写实图为例，参考生成参数如下。

ckpt 检查点模型：majicMIX realistic 麦橘写实_v7
正向提示词（中文）：两个穿着圣诞毛衣的可爱女孩，身处雪景之中，水彩画风格，在艺术网站上热门，焦点清晰，工作室照片，细节精致，高度写实
正向提示词（英文）：two adorable gril,wearing christmas sweaters,in a snowy christmas scene,Watercolor,trending on artstation,sharp focus,studio photo,intricate details,highly detailed
负向提示词：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler a
迭代步数：25
图片尺寸：768x1024
提示词引导系数：7

生成效果：

将上图发送至图生图，参考生成参数如下。

重绘幅度：0
随机数种子：757092860

Tiled Diffusion/Tiled VAE 参考插件参数如下。

Tiled Diffusion/Tiled VAE：开启
方案：MultiDiffusion
放大算法：R-ESRGAN_4x+
放大倍数：4（768x1024～3072x4096）

生成后对比效果：

LiblibAI 超清放大

超清放大是由 LiblibAI 自带的的类似于 Tiled Diffusion 插件的高清放大功能。

超清放大的核心参数：

重绘幅度：建议不超过 0.4，过高的重绘幅度会导致画面变化过大，以及画出不需要的元素。
全面增强：重绘幅度高于 0.5 时建议开启，有助于在保持一致性的同时丰富图像细节。此设置在基础算法 1.5 下表现更稳定，基础算法 XL 下可能会出现色彩失真的情况。
细节强化：丰富画面细节，但可能导致画面内容变化。
画质增强：提升画质，建议在 0.5～1.5 之间调节。

高级图像处理插件

Layer diffusion

Layer diffusion 是由 lllyasviel 团队推出的 Stable Diffusion 扩展技术，能让 Stable Diffusion 支持原生生成带 Alpha 通道的透明图像与多图层内容，无需额外抠图，适配 SD 1.5/XL，大幅提升设计类图像的生产效率。

本地部署的 Stable Diffusion 需要自行安装 Layer diffusion 插件，LiblibAI 已内置该插件。

Layer diffusion 的安装与使用：https://github.com/layerdiffusion/sd-forge-layerdiffuse

Layer diffusion 的核心参数：

启用开关：开启 Layer diffusion 后最终图片尺寸会自适应到 64 的倍数。
Method：指定 Layer diffusion 的工作机制，适配不同的模型版本与生成目标。
Weight：控制 Layer diffusion 的透明效果强度，决定背景被替换为透明的程度。取值范围为 0～2，1.0 即标准透明强度，背景完全透明且主体边缘干净，数值越高透明效果增强，但可能误将主体边缘判定为背景。
Stop at：控制 Layer diffusion 在扩散过程中停止干预的时机，平衡透明效果与内容完整性。取值范围为 0～1，1.0 即 Layer diffusion 全程参与扩散，透明效果最彻底，但复杂场景可能出现主体细节缺失。

以生成一张电商产品图为例，参考生成参数如下。

ckpt 检查点模型：电商产品场景_XL
正向提示词（中文）：超高清细节，图像展现了一个时尚的矩形香水瓶，配有金色瓶盖和标签，瓶子放置在反光表面上，营造出戏剧性的阴影，光线从上方照射在瓶子上，在深色背景的映衬下，凸显出其优雅的设计
正向提示词（英文）：ultra high definition details,the image features a sleek,rectangular perfume bottle with a gold cap and label,the bottle is placed on a reflective surface,creating a dramatic shadow,light rays illuminate the bottle from above,highlighting its elegant design against a dark background
负向提示词：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：DPM++ 2M Karras
迭代步数：30
图片尺寸：768x1024
提示词引导系数：7

Layer diffusion 参考插件参数如下。

Layer diffusion：开启
Method：(基础算法 XL) 生成透明底的图片 (Conv Injection)
Weight：1.0
Stop at：1.0

生成效果：

ADetailer

ADetailer（After Detailer）是 Stable Diffusion 的核心细节修复插件，在生成后自动检测人脸、手部等易崩坏区域，通过蒙版 + 局部重绘提升细节，适配 SD1.5/XL，是解决脸崩手残的高效工具。

本地部署的 Stable Diffusion 需要自行安装 ADetailer 插件，LiblibAI 已内置该插件。

ADetailer 的安装与使用：https://github.com/Bing-su/adetailer

ADetailer 的核心参数：

模型选择：选择检测目标时所使用的模型，如人脸 face_xxx.pt、手部 hand_xxx.pt、身体 person_xxx.pt 等。
ADetailer 正向提示词：修复区域专用正向提示词，针对性强化细节，避免风格漂移。
ADetailer 负向提示词：修复区域专用负向提示词，补充模糊、失真、结构异常等负向提示词，抑制缺陷。
目标检测阈值：控制哪些区域会被判定为目标。取值范围为 0～1，数值越高越严格、误检越少，但也越容易漏检小/模糊目标。
最小面积比例：按蒙版面积占图像总面积的比例设定下限，仅保留 >= 该值的蒙版。取值范围为 0～1，数值越高越易筛除小噪点、杂物，但也可能漏检小目标。
最大面积比例：按蒙版面积占图像总面积的比例设定上限，仅保留 <= 该值的蒙版。取值范围为 0～1，数值越高越允许大目标蒙版，越低越能防止蒙版覆盖大区域导致画面崩坏。
蒙版的预处理：用于对 ADetailer 自动检测生成的蒙版进行位移、缩放、模糊、合并等调整，校准目标区域范围、柔化边缘，避免重绘出现生硬边界。
局部重绘：仅用于对预处理后的蒙版区域执行图像重绘，通过去噪强度、采样步数等参数控制修复幅度，在保留原图风格的前提下优化目标区域细节。

以生成一张人物写实图为例，参考生成参数如下。