点赞 + 关注 + 收藏 = 学会了

本文简介

在使用 SD 文生图功能时，我们能选得大模型大致有两类，一类是普通模型，另一类是更加新的 SDXL 模型。

普通模型就是 SD 的一些旧版模型，是将 SD 1.5 或 SD 2.0 作为底模开发出来的模型。这类模型也是我们现阶段用得最多的模型。它的基础分辨率是 512 x 512 像素。

如果我们需要将增加图片分辨率，直接修改文生图的 width 和 height 出来的效果并不会很好。有时候会还会出现多头的情况，例如下图这种情况。

出现这种情况的原因是画面变大了，人家原本擅长绘画的尺寸是 512 x 512 ，而你现在一下子就将画布变大了很多，AI 自由绘画的像素点就变多了，这就有可能出现不合理叠加等问题。

高清修复功能 Hires. fix

介绍

那如果需要生成一张高分辨率的照片，又不想出现这种诡异的情况要怎么办呢？

我们可以使用 SD 提供的 Hires. fix 功能去放大图片。

也就是我们先生成图片，基于这个图片的内容选择一个放大算法去提升图片的分辨率，然后基于这个基础上再整体重绘图片。

看看这个实例：


768 x 512	1536 x 1024

左图的分辨率是 768 x 512，右图使用了 Hires. fix 功能放大了 2 倍。

在使用 Hires. fix 出来的效果是不错的，细节也更加丰富，但随之而来的缺点也很明显，启用了 Hires. fix 对图片进行放大，出图的时间会大幅增长，配置不高的设备甚至会爆显存。如果配置不高的电脑尽量不要将图片放大得太多，建议不超2倍。

实操

接下来是实操环境。

咒语：

yaml 复制代码

(best quality, masterpiece, perfect face, beautiful and aesthetic:1.2, colorful, dynamic angle), handsome beautiful woman humanoid woman robot part metal wires with wavy short dark hair, elegant, red lighting, realistic, concept art, smooth, detailed, high quality, alphonse mucha and waterhouse,, <lora:add_detail:0.5>, (high contrast, official art, extreme detailed, highest detailed)
Negative prompt: portrait, doll, (leaning against wall:1.3), (asian, chinese:1.3), (worst quality, low quality), FastNegativeV2
Steps: 20, Sampler: DPM++ 2M SDE, Schedule type: Exponential, CFG scale: 6, Seed: 2055601004, Face restoration: CodeFormer, Size: 768x512, Model hash: 07341fcad2, Model: aniverse_v30Pruned, Downcast alphas_cumprod: True, Version: v1.9.3

本例用到的模型下载地址：civitai.com/models/1078...

首先我们导入咒语，你也可以设置自己的提示词和参数。然后设置图片的宽高。这里我选择的是 768 x 512 ，也就是一张横屏的图片。

然后选择上图中红框上方的 Hires. fix。选中后展开它，在 Upscale by 这一项中设置 2 ，也就是等比放大2倍。

接着我还将 Denoising strength 设置成 0.6 ，这个参数的意思是重绘幅度。在高清修复后还会对图片进行整体重绘，这个数值越高，重绘出来的图片就会和原图相差很大。

最后点击生成按钮。

Hires. fix 参数讲解

在 Hires. fix 面板中还有很多参数可以配置。

放大算法 Upscaler

Upscaler 选项中可以选择不同的高清算法对图片进行放大。

Latent：Latent开头的算法是一种简单直接的放大算法，对电脑配置要求不高，速度很快，但出图效果不是很好，可能会出现模糊不清晰等情况。
Lanczos：当放大图像时，它通过计算权重，在原图的每个像素周围插入新的像素；当缩小图像时，它会从原图每个像素周围的像素中选择一个值来替换这个像素。这个算法的运算速度也算快，出图效果也还行，能用。
Nearest：是一种插值算法，通过缩放系数计算目标图像在原图中的坐标位置，然后找到原图中距离该位置最近的像素值，将其作为目标图像当前像素的数值。运算速度很快，但可能会产生锯齿或者块状瑕疵，效果不太好。
ESRGAN_4x：通过学习低分辨率图像与其对应高分辨率图像之间的映射关系，实现从低分辨率图像到高分辨率图像的映射过程，进而实现图像的超分辨率。分辨率最高可增强4倍，但可能会出现锐化效果。适合油画风。
LDSR：通过训练的潜在扩散模型来提升图像的分辨率，出图效果很好 ，出图的细节全给你拉满，但很吃电脑资源，运算速度也很慢，可以用龟速来形容了。
R-ESRGAN 4x+：通过引入残差连接和递归结构，并使用生成对抗网络进行训练，在提高图像分辨率的同时也完善了图像细节，生成图像的质量比传统方法更高，推荐。
R-ESRGAN 4x+ Anime6B：是 R-ESRGAN 4x+ 的一个衍生版本，修复二次元漫画的效果很好。
ScuNet GAN：可以去除图像噪声，同时保留原始细节，但速度慢。可以去除照片和绘画的早点。不太适合二次元漫画，但也勉强能用。
ScuNET PSNR：降噪效果很好，适用于需要保持更多图像细节、纹理、颜色等信息的处理场景，速度也很慢。不适合二次元漫画。
SwinIR 4x：可将低分辨率图像发达为原来的4倍，生成高分辨率图像。可增强图像的真实感和清晰度。适用于图像重建、图像增强和图像超分辨率等方面，但出图速度很慢，适合修复绘画，不适合二次元漫画。