AI绘画软件Stable Diffusion详解教程(7):图生图基础篇

我们在使用AI魔盒不停的绘制一幅幅图像时,会有这样的疑问:为什么生成的图像随机性这么强?我们如何按照自己的构图创作作品?为什么提示词生成的图像细节不够?如何把手绘的风格转换成另一种风格,或者说把自己的照片转换成另一种风格?

以上问题除了可以通过lora、controlnet等微调模型来实现,我们还可以通过图生图来解决,微调模型相对复杂,我们先来学习一下图生图。图生图的标签在下图箭头处:

图生图中又有不同的绘图功能,本篇主要讲一部分基础功能和常见参数设置。

一、图生图(img2img)的参数

图生图的工作方式与文生图有所不同,文生图直接通过噪声产生图像,而图生图是图像和噪声一起结合运算的结果,其原理是在一副初始图的基础上添加噪点,然后根据提示词扩散去噪,最后形成新的图像。)

1.重绘强度

添加的噪声量取决于重绘幅度参数,该参数的范围从0到1,0表示不添加噪声,生成的图像和原图像相同,而1表示完全用噪声替换图像,实质上等同于文生图。

原图:(使用DreamShaperXL基础模型绘制):

重绘幅度为0:(使用revAnimated基础模型绘制)

重绘幅度为0.3:

重绘幅度为0.5:

重绘幅度为0.7:

可以看出,重绘幅度到0.7的时候和原图的偏离度已经很大了。

2.提示词引导系数(CFG Scale)

和文生图一样,提示词引导系数非常重要,参数越大,提示词强度越强,生成的图像就越符合提示词的要求,但一般不超过20,以避免过度依赖提示词导致图像失去多样性。

3.缩放模式

(1)拉伸

此模式仅调整图片大小,会导致图片变形,结果如下:

(2)裁剪

会根据新的尺寸截掉多余的部分。

(3)填充

看起来和原图一样,但是像素变大了一倍。可以用于扩充图像的像素,此方法最常用,比如用于修复不清晰的照片。

(4)直接缩放

和第(1)中拉伸效果相同,只不过用的不同的算法来实现,图像质量一般还不如第一种。

二、图生图其它面板参数

1.涂鸦绘制(Sketch)

2.局部绘制(Inpaint)

3.局部绘制(涂鸦蒙版)(Inpaint sketch)

4.局部绘制(上传蒙版)(Inpaint upload)

5.批量处理(Batch)

以上功能在后续篇幅逐一详解,今天就先写到这里。

相关推荐
deephub12 分钟前
CLIMB自举框架:基于语义聚类的迭代数据混合优化及其在LLM预训练中的应用
人工智能·深度学习·大语言模型·聚类
思通数科AI全行业智能NLP系统2 小时前
AI视频技术赋能幼儿园安全——教师离岗报警系统的智慧守护
大数据·人工智能·安全·目标检测·目标跟踪·自然语言处理·ocr
struggle20252 小时前
deepseek-cli开源的强大命令行界面,用于与 DeepSeek 的 AI 模型进行交互
人工智能·开源·自动化·交互·deepseek
ocr_sinosecu13 小时前
OCR定制识别:解锁文字识别的无限可能
人工智能·机器学习·ocr
奋斗者1号3 小时前
分类数据处理全解析:从独热编码到高维特征优化
人工智能·机器学习·分类
契合qht53_shine4 小时前
深度学习 视觉处理(CNN) day_02
人工智能·深度学习·cnn
就叫飞六吧4 小时前
如何判断你的PyTorch是GPU版还是CPU版?
人工智能·pytorch·python
zsffuture4 小时前
opencv 读取3G大图失败,又不想重新编译opencv ,可以如下操作
人工智能·opencv·webpack
AntBlack4 小时前
别说了别说了 ,Trae 已经在不停优化迭代了
前端·人工智能·后端
訾博ZiBo4 小时前
AI日报 - 2025年04月28日
人工智能