AI绘画软件Stable Diffusion详解教程（7）：图生图基础篇

我们在使用AI魔盒不停的绘制一幅幅图像时，会有这样的疑问：为什么生成的图像随机性这么强？我们如何按照自己的构图创作作品？为什么提示词生成的图像细节不够？如何把手绘的风格转换成另一种风格，或者说把自己的照片转换成另一种风格？

以上问题除了可以通过lora、controlnet等微调模型来实现，我们还可以通过图生图来解决，微调模型相对复杂，我们先来学习一下图生图。图生图的标签在下图箭头处：

图生图中又有不同的绘图功能，本篇主要讲一部分基础功能和常见参数设置。

一、图生图(img2img)的参数

图生图的工作方式与文生图有所不同，文生图直接通过噪声产生图像，而图生图是图像和噪声一起结合运算的结果，其原理是在一副初始图的基础上添加噪点，然后根据提示词扩散去噪，最后形成新的图像。）

添加的噪声量取决于重绘幅度参数，该参数的范围从0到1,0表示不添加噪声，生成的图像和原图像相同，而1表示完全用噪声替换图像，实质上等同于文生图。

原图：（使用DreamShaperXL基础模型绘制）：

重绘幅度为0：（使用revAnimated基础模型绘制）

重绘幅度为0.3：

重绘幅度为0.5：

重绘幅度为0.7：

可以看出，重绘幅度到0.7的时候和原图的偏离度已经很大了。

和文生图一样，提示词引导系数非常重要，参数越大，提示词强度越强，生成的图像就越符合提示词的要求，但一般不超过20，以避免过度依赖提示词导致图像失去多样性。

（1）拉伸

此模式仅调整图片大小，会导致图片变形，结果如下：

（2）裁剪

会根据新的尺寸截掉多余的部分。

（3）填充

看起来和原图一样，但是像素变大了一倍。可以用于扩充图像的像素，此方法最常用，比如用于修复不清晰的照片。

（4）直接缩放

和第（1）中拉伸效果相同，只不过用的不同的算法来实现，图像质量一般还不如第一种。