Stable Diffusion AIGC 视觉设计实战教程之 08-高级图像处理

高清放大

高分辨率修复

Stable Diffusion 文生图的高分辨率修复(Hires.fix)核心采用低分辨率打底 + 高分辨率重绘的两阶段流程,既能提升分辨率,又能保证构图与细节,是解决大尺寸生成模糊、细节不足等问题的方案。

高分辨率修复分两步完成高清化:

  • 第一阶段:按设定的低分辨率生成基础图,确保构图准确。
  • 第二阶段:将基础图通过放大算法提升至目标分辨率,再添加适量噪声后,用扩散模型去噪重绘,补充细节并修正失真,最终输出高清图。

高分辨率修复的核心参数:

  • 放大算法:决定低分辨率图放大到高分辨率时的像素重建逻辑,直接影响细节精度与风格匹配度。
  • 放大倍率:从基础低分辨率图到最终高分辨率图的缩放比例(等比缩放),低显存优先选择 1.5~2.0 倍,生成超大幅图不建议单次使用高倍率。
  • 将宽度/高度调整到:手动指定缩放的宽度和高度。
  • 重绘幅度:控制高分辨率修复第二阶段去噪重绘的幅度,取值范围为 0~1,0 即完全不重绘仅简单放大,1 即完全抛弃原图重新生成高分辨率图,0.3~0.5 能保留 90%+ 原构图,新增中等细节(如皮肤纹理、毛发等),适合绝大多数场景。重绘幅度尽可能不要超过 0.6,避免出现变形风险。
  • 重绘采样步数:控制高分辨率修复第二阶段去噪重绘的步数,推荐取值范围为基础迭代步数的 2/3。

高分辨率修复常用的放大算法:

  • R-ESRGAN 4x+:通用型算法,细节锐化强,修复模糊边缘效果好,适合照片、写实插画、风景图等高清放大,但过度锐化易产生塑料感。
  • R-ESRGAN 4x+ Anime6B:针对二次元优化,线条更流畅,色彩更鲜艳,适合动漫、漫画、二次元角色图等高清放大,用于写实图高清放大时容易失真。
  • SwinIR 4x:细节还原细腻,保留纹理自然度(如皮肤、布料等),适合人像、写实摄影、高精度插画等高清放大,但生成速度较慢,对模糊图修复力弱。
  • Latent:潜空间放大,在画面放大的同时不会增加画面细节,但整体比较柔和,适合所有场景。
  • 4x_NMKD-Superscale:平衡细节与自然度,对低清图修复效果突出,适合老照片修复、低分辨率素材重绘,但生成时间较长。
  • Lanczos:轻量、快速且风格中性的图像放大算法,低失真、无过度锐化,适合作为主算法快速预览,或作为辅算法修正其他强锐化算法的缺陷。

以生成一张人物写实图为例,参考生成参数如下。

  • ckpt 检查点模型:麦橘超然 majicFlus
  • 正向提示词(中文):一个女孩,独自一人,从下方视角,樱花,户外,棕色头发,白天,衬衫,写实风格,天空,棕色眼睛,蓝天,模糊,粉色衬衫,嘴唇,微张的嘴唇,条纹衬衫,上半身,向下看,条纹,树
  • 正向提示词(英文):1girl, solo, from below, cherry blossoms, outdoors, brown hair, day, shirt, realistic, sky, brown eyes, blue sky, blurry, pink shirt, lips, parted lips, striped shirt, upper body, looking down, striped, tree
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler a
  • 迭代步数:20
  • 提示词引导系数:7
  • 图片尺寸:512x512

生成效果:

调整生成参数如下。

  • 随机数种子:955073264
  • 高分辨率修复:开启
  • 放大算法:R-ESRGAN 4x+
  • 放大倍率:3(512x512~1536x1536)
  • 放大重绘幅度:0.3

生成效果:

后期处理附加功能放大

Stable Diffusion 中的附加功能后期处理,也为创作者提供了丰富的图片处理选项,创作者也可以使用附加功能后期处理实现高清放大。

后期处理附加功能放大允许用户自己上传自己的图片,并直接提高图片的分辨率,不会对原图进行任何形式的重绘和修改,而是直接对图片的分辨率进行提升。

后期处理附加功能高清放大的核心参数:

  • 放大倍率、将宽度/高度调整到:调整放大的尺寸/倍率。

  • 放大算法:支持 Upscaler1(主算法)、Upscaler2(可选辅助算法),主算法 + 辅助算法结合可以在一定程度上避免单算法的锐化过度、油光或细节不足等问题。

  • Upscaler 2 可见度:用来调节辅算法与主算法的混合比例。取值范围为 0~1,数值越小,主算法的效果占比越高,数值越接近 1,辅助算法的效果占比越高。

  • GFPGAN 可见度:针对模糊、变形、低清人脸的修复算法,能快速改善严重失真的人脸,但修复过度时容易出现塑料感或面部细节丢失。取值范围为 0~1,数值越大,对应的人脸修复算法效果越明显,数值越小,则越贴近原图的人脸质感,修复效果越弱。

  • CodeFormer 可见度:更精细的人脸修复算法,修复效果更自然,对皮肤纹理、五官细节的保留更好,塑料感远低于 GFPGAN,适合对人脸真实度要求高的场景。

下图原始尺寸为 512x512。

以上图为例进行后期处理附加功能放大,参考生成参数如下。

  • 放大倍率:4(512x512~2048x2048)
  • Upscaler1:R-ESRGAN_4x+
  • Upscaler2:Lanczos
  • Upscaler 2 可见度:0.3
  • CodeFormer 可见度:0.8

生成效果:

图生图直接放大

在 Stable Diffusion 中,高清放大图像还可以借助图生图功能设置图像的分辨率和重绘幅度等参数来实现,但此方法也有尺寸上限的局限性,当分辨率过大时可能会导致无法生图等问题。

SD Upscale

SD Upscale 插件是 Stable Diffusion 的专用放大脚本,是早期实现超分放大的标准化工具,在一些本地部署的 Stable Diffusion 中可以使用该内置插件实现高清放大。

SD Upscale 的核心原理是将原图切割成一个个图块,针对每一个图块分别进行高清修复,完成修复后再将这些图块重新拼接,最终得到放大且高清的图像。

在这个过程中,分块重叠像素宽度扮演着关键角色,其本质是为了避免拼接痕迹,提升图像的整体连贯性。由于每个图块在修复时是独立进行的,如果图块之间没有重叠部分,直接拼接可能会在接缝处出现明显的色差、纹理不连续等问题。

设置分块重叠像素宽度后,在修复过程中,这部分重叠区域会被重复处理,模型会综合考虑相邻图块的信息,对重叠部分进行融合优化。当完成所有图块的修复和拼接后,重叠区域经过处理,使得图像过渡自然,大幅减少了拼接产生的违和感,最终呈现出视觉效果更好的放大图像。

Ultimate SD Upscale

Ultimate SD Upscale(USD)是 SD Upscale 的进阶扩展插件,核心优势在于更强的细节控制、无缝拼接与显存适配,适合高倍数、超高清放大、精细细节修复。

Ultimate SD Upscale 插件的安装与使用:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111

Tiled Diffusion

Tiled Diffusion 是 Stable Diffusion 的高分辨率生成专用扩展插件,核心逻辑是将目标尺寸的大图,按规则分割成多个独立小图块,分别执行扩散生成、放大计算,最后通过算法无缝拼接,能以更小的计算成本更稳定地输出超高清图像,速度快、细节完整。

Tiled Diffusion 是由 Tiled Diffusion 插件、Tiled VAE 插件组成,Tiled Diffusion 负责高分辨率图像的分块生成与无缝拼接,Tiled VAE 负责分块编码解码以避免画质崩坏,二者是高分辨率生成的配套组合,在使用时必须同时启用才能兼顾低显存占用与高清画质。

Tiled Diffusion 和 SD Upscale 的核心区别:

  • Tiled Diffusion 在潜空间分块计算,显存占用极低,而 SD Upscale 在像素空间分步放大 + 重绘,显存压力大。
  • Tiled Diffusion 主打一步到位生成、放大 8K 级大图,而 SD Upscale 适合中小尺寸分步放大。
  • Tiled Diffusion 全局一致性强,但参数不当易出拼接缝,而 SD Upscale 无拼接问题,但分步重绘可能有风格断层。

本地部署的 Stable Diffusion 需要自行安装 Tiled Diffusion 插件、Tiled VAE 插件,LiblibAI 已内置该插件,使用时需要注意部分检查点模型不支持使用 Tiled Diffusion 插件。

Tiled Diffusion 的安装与使用:https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111

Tiled Diffusion 的核心参数:

模块 名称 描述 推荐
Tiled Diffusion 通用 方案 Mixture of Diffusers 适合局部重绘 MultiDiffusion 能确保分块内容一致性,生成大图无明显拼接痕 MultiDiffusion
潜空间分块宽 / 高 用于把超大尺寸图片的运算空间拆成小块分别处理 取值范围 = 16 ~ (检查点模型能生成的最大图片尺寸 / 8) 96
潜空间分块重叠 设置相邻分块的重叠区域,消除拼接缝 MultiDiffusion 方案设置为 32 或 48 Mixture of Diffusers 方案设置为 16 或 32 48
分块单批数量 指定一次同时处理多少个拆分好的小块,数量越少越省显存、越稳定 1
分区提示词控制 把图像按潜空间分块划分为多个区域,给每个区域单独写提示词 -
Tiled Diffusion 文生图 覆盖图像尺寸 勾选后按目标分辨率计算分块,可突破原生图片尺寸限制 -
Tiled Diffusion 图生图 保持输入图像大小 控制图生图的输出尺寸是否与原图一致 用于修复细节勾选,用于超清放大取消勾选 -
放大倍数 放大后图片尺寸 = 原图尺寸 x 放大倍数 -
放大算法 无约束,优先 Lanczos Lanczos
噪声反转 高清放大必开,细节修复可选 -
反转步数 越小越贴近原图,越大创作空间越大 10
修复程度 数值越大越贴近原图 -
重铺噪声强度 数值越大,越能增加噪声随机性,生成的细节更丰富 数值过高会偏离原图 ≤0.6
重铺噪声大小 数值越大,噪声覆盖的区域越广,越适合优化大场景细节 64
Tiled VAE 编码器分块大小 控制 VAE 编码阶段的分块尺寸,单位为潜空间单位 用于降低显存峰值占用,实现大尺寸图像编码 建议在 CUDA error: out of memory 报错前尽可能大的设置其值 1024
解码器分块大小 控制 VAE 解码阶段的分块尺寸,单位为潜空间单位 用于匹配编码器分块逻辑,延续显存优化策略 192
快速编码解码器 启用轻量化编解码算法,开启后速度提升 30%-50% 开启
快速编码器颜色修复 校准分块色偏,优先开启 开启

以生成一张人物写实图为例,参考生成参数如下。

  • ckpt 检查点模型:majicMIX realistic 麦橘写实_v7
  • 正向提示词(中文):两个穿着圣诞毛衣的可爱女孩,身处雪景之中,水彩画风格,在艺术网站上热门,焦点清晰,工作室照片,细节精致,高度写实
  • 正向提示词(英文):two adorable gril,wearing christmas sweaters,in a snowy christmas scene,Watercolor,trending on artstation,sharp focus,studio photo,intricate details,highly detailed
  • 负向提示词:ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler a
  • 迭代步数:25
  • 图片尺寸:768x1024
  • 提示词引导系数:7

生成效果:

将上图发送至图生图,参考生成参数如下。

  • 重绘幅度:0
  • 随机数种子:757092860

Tiled Diffusion/Tiled VAE 参考插件参数如下。

  • Tiled Diffusion/Tiled VAE:开启
  • 方案:MultiDiffusion
  • 放大算法:R-ESRGAN_4x+
  • 放大倍数:4(768x1024~3072x4096)

生成后对比效果:

LiblibAI 超清放大

超清放大是由 LiblibAI 自带的的类似于 Tiled Diffusion 插件的高清放大功能。

超清放大的核心参数:

  • 重绘幅度:建议不超过 0.4,过高的重绘幅度会导致画面变化过大,以及画出不需要的元素。
  • 全面增强:重绘幅度高于 0.5 时建议开启,有助于在保持一致性的同时丰富图像细节。此设置在基础算法 1.5 下表现更稳定,基础算法 XL 下可能会出现色彩失真的情况。
  • 细节强化:丰富画面细节,但可能导致画面内容变化。
  • 画质增强:提升画质,建议在 0.5~1.5 之间调节。

高级图像处理插件

Layer diffusion

Layer diffusion 是由 lllyasviel 团队推出的 Stable Diffusion 扩展技术,能让 Stable Diffusion 支持原生生成带 Alpha 通道的透明图像与多图层内容,无需额外抠图,适配 SD 1.5/XL,大幅提升设计类图像的生产效率。

本地部署的 Stable Diffusion 需要自行安装 Layer diffusion 插件,LiblibAI 已内置该插件。

Layer diffusion 的安装与使用:https://github.com/layerdiffusion/sd-forge-layerdiffuse

Layer diffusion 的核心参数:

  • 启用开关:开启 Layer diffusion 后最终图片尺寸会自适应到 64 的倍数。

  • Method:指定 Layer diffusion 的工作机制,适配不同的模型版本与生成目标。

  • Weight:控制 Layer diffusion 的透明效果强度,决定背景被替换为透明的程度。取值范围为 0~2,1.0 即标准透明强度,背景完全透明且主体边缘干净,数值越高透明效果增强,但可能误将主体边缘判定为背景。

  • Stop at:控制 Layer diffusion 在扩散过程中 停止干预的时机,平衡透明效果与内容完整性。取值范围为 0~1,1.0 即 Layer diffusion 全程参与扩散,透明效果最彻底,但复杂场景可能出现主体细节缺失。

以生成一张电商产品图为例,参考生成参数如下。

  • ckpt 检查点模型:电商产品场景_XL
  • 正向提示词(中文):超高清细节,图像展现了一个时尚的矩形香水瓶,配有金色瓶盖和标签,瓶子放置在反光表面上,营造出戏剧性的阴影,光线从上方照射在瓶子上,在深色背景的映衬下,凸显出其优雅的设计
  • 正向提示词(英文):ultra high definition details,the image features a sleek,rectangular perfume bottle with a gold cap and label,the bottle is placed on a reflective surface,creating a dramatic shadow,light rays illuminate the bottle from above,highlighting its elegant design against a dark background
  • 负向提示词:ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:DPM++ 2M Karras
  • 迭代步数:30
  • 图片尺寸:768x1024
  • 提示词引导系数:7

Layer diffusion 参考插件参数如下。

  • Layer diffusion:开启
  • Method:(基础算法 XL) 生成透明底的图片 (Conv Injection)
  • Weight:1.0
  • Stop at:1.0

生成效果:

ADetailer

ADetailer(After Detailer)是 Stable Diffusion 的核心细节修复插件,在生成后自动检测人脸、手部等易崩坏区域,通过蒙版 + 局部重绘提升细节,适配 SD1.5/XL,是解决脸崩手残的高效工具。

本地部署的 Stable Diffusion 需要自行安装 ADetailer 插件,LiblibAI 已内置该插件。

ADetailer 的安装与使用:https://github.com/Bing-su/adetailer

ADetailer 的核心参数:

  • 模型选择:选择检测目标时所使用的模型,如人脸 face_xxx.pt、手部 hand_xxx.pt、身体 person_xxx.pt 等。
  • ADetailer 正向提示词:修复区域专用正向提示词,针对性强化细节,避免风格漂移。
  • ADetailer 负向提示词:修复区域专用负向提示词,补充模糊、失真、结构异常等负向提示词,抑制缺陷。
  • 目标检测阈值:控制哪些区域会被判定为目标。取值范围为 0~1,数值越高越严格、误检越少,但也越容易漏检小/模糊目标。
  • 最小面积比例:按蒙版面积占图像总面积的比例设定下限,仅保留 >= 该值的蒙版。取值范围为 0~1,数值越高越易筛除小噪点、杂物,但也可能漏检小目标。
  • 最大面积比例:按蒙版面积占图像总面积的比例设定上限,仅保留 <= 该值的蒙版。取值范围为 0~1,数值越高越允许大目标蒙版,越低越能防止蒙版覆盖大区域导致画面崩坏。
  • 蒙版的预处理:用于对 ADetailer 自动检测生成的蒙版进行位移、缩放、模糊、合并等调整,校准目标区域范围、柔化边缘,避免重绘出现生硬边界。
  • 局部重绘:仅用于对预处理后的蒙版区域执行图像重绘,通过去噪强度、采样步数等参数控制修复幅度,在保留原图风格的前提下优化目标区域细节。

以生成一张人物写实图为例,参考生成参数如下。

  • ckpt 检查点模型:majicMIX realistic 麦橘写实_v7
  • 正向提示词(中文):一个女孩
  • 正向提示词(英文):1girl
  • 负向提示词:ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler a
  • 迭代步数:20
  • 图片尺寸:512x512
  • 提示词引导系数:7

生成效果:

调整生成参数如下。

  • 随机数种子:4063326573

ADetailer 参考插件参数如下。

  • ADetailer:开启
  • 模型选择:face_yolov8n
  • 目标检测阈值:0.3

生成效果:

Inpaint Anything

Inpaint Anything 是一款基于 Segment Anything Model(SAM)的智能局部重绘插件,核心是点击即分割、文本控生成,无需手动精细绘制蒙版,即可精准移除、替换或填充图像中任意物体、区域,适配物体移除、背景替换、局部内容生成等场景。

本地部署的 Stable Diffusion 需要自行安装 Inpaint Anything 插件,LiblibAI 已内置该插件。

Inpaint Anything 的安装与使用:https://github.com/Uminosachi/sd-webui-inpaint-anything

下图原始尺寸为 1024x1024,以下图为例进行局部重绘。

打开 Inpaint Anything 插件,将需要重绘的图片上传至 Inpaint Anything 插件,确认已选好 SAM 模型,点击 Run Segment Anything,生成彩色分割图。

在彩色分割图中,使用画笔工具涂抹或点击分割图中需重绘的目标区域,点击创建蒙版,下方会显示选中的蒙版区域。

在蒙版区域中,根据实际情况修剪、添加蒙版。

切换到仅蒙版标签,点击获取蒙版,再点击发送到图生图重绘,在图生图页面进一步调整参数。

以上图为例进行图生图,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):宽松的粉色短款 T 恤
  • 正向提示词(英文):Loose pink short-sleeved T-shirt,
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x1024
  • 缩放模式:填充
  • 蒙版边缘模糊度:6
  • 重绘幅度:0.95
  • 蒙版模式:重绘蒙版内容

生成效果:

PNG 图片信息

获取图片信息

PNG 图片信息是核心实用功能,可以读取由 Stable Diffusion 平台生成的 PNG 图片中内嵌的生成元数据,快速复用这些参数到其他功能模块,不管是复刻自己的作品,还是学习他人的创作参数都很便捷。

只有 Stable Diffusion 生成且未清除元数据的 PNG 图才能读取到这些元信息,非 Stable Diffusion 生成或二次编辑、重新保存导致元数据丢失的图片,无法读取到对应内容。

PNG 图片信息功能仅针对 PNG 图的元数据做读取,并非通过 AI 反推图像参数,和 CLIP 反推、DeepBooru 反推、WD 1.4 标签器等提示词反推功能有着本质区别。

如果想保护自己的创作参数不被他人读取,可通过 Photoshop 等工具重新导出图片,这样会清除图片中的生成元数据。

相关推荐
SharpCJ20 分钟前
Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革
android·ai·aigc
墨风如雪1 小时前
玩转本地 AI 的“第 0 步”:Node.js 环境保姆级安装教程
aigc
就是这么拽呢4 小时前
论文查重低但AIGC率高,如何补救?
论文阅读·人工智能·ai·aigc
Bigger6 小时前
第一章:我是如何剖析 Claude Code 整体架构与启动流程的
前端·aigc·claude
树獭叔叔6 小时前
Claude Code 工具系统深度剖析:从静态注册到动态发现
后端·aigc·openai
云边云科技_云网融合6 小时前
详解Token经济:智能时代的价值标尺与产业全链路重构
人工智能·aigc·token
树獭叔叔6 小时前
Claude Code 的上下文管理:多层渐进式压缩架构深度解析
后端·aigc·openai
AI攻城狮6 小时前
Anthropic 开源了 Claude 的 Agent Skills 仓库:文档技能的底层实现全公开了
人工智能·云原生·aigc
星纬智联技术7 小时前
深度测评:GEO优化实战,如何构建AI搜索引擎偏爱的“高引用体质”?
人工智能·aigc·geo
AI先驱体验官7 小时前
实时交互数字人:企业服务场景的技术落地分析
大数据·运维·人工智能·重构·aigc