AI绘画软件Stable Diffusion详解教程(7):图生图基础篇

我们在使用AI魔盒不停的绘制一幅幅图像时,会有这样的疑问:为什么生成的图像随机性这么强?我们如何按照自己的构图创作作品?为什么提示词生成的图像细节不够?如何把手绘的风格转换成另一种风格,或者说把自己的照片转换成另一种风格?

以上问题除了可以通过lora、controlnet等微调模型来实现,我们还可以通过图生图来解决,微调模型相对复杂,我们先来学习一下图生图。图生图的标签在下图箭头处:

图生图中又有不同的绘图功能,本篇主要讲一部分基础功能和常见参数设置。

一、图生图(img2img)的参数

图生图的工作方式与文生图有所不同,文生图直接通过噪声产生图像,而图生图是图像和噪声一起结合运算的结果,其原理是在一副初始图的基础上添加噪点,然后根据提示词扩散去噪,最后形成新的图像。)

1.重绘强度

添加的噪声量取决于重绘幅度参数,该参数的范围从0到1,0表示不添加噪声,生成的图像和原图像相同,而1表示完全用噪声替换图像,实质上等同于文生图。

原图:(使用DreamShaperXL基础模型绘制):

重绘幅度为0:(使用revAnimated基础模型绘制)

重绘幅度为0.3:

重绘幅度为0.5:

重绘幅度为0.7:

可以看出,重绘幅度到0.7的时候和原图的偏离度已经很大了。

2.提示词引导系数(CFG Scale)

和文生图一样,提示词引导系数非常重要,参数越大,提示词强度越强,生成的图像就越符合提示词的要求,但一般不超过20,以避免过度依赖提示词导致图像失去多样性。

3.缩放模式

(1)拉伸

此模式仅调整图片大小,会导致图片变形,结果如下:

(2)裁剪

会根据新的尺寸截掉多余的部分。

(3)填充

看起来和原图一样,但是像素变大了一倍。可以用于扩充图像的像素,此方法最常用,比如用于修复不清晰的照片。

(4)直接缩放

和第(1)中拉伸效果相同,只不过用的不同的算法来实现,图像质量一般还不如第一种。

二、图生图其它面板参数

1.涂鸦绘制(Sketch)

2.局部绘制(Inpaint)

3.局部绘制(涂鸦蒙版)(Inpaint sketch)

4.局部绘制(上传蒙版)(Inpaint upload)

5.批量处理(Batch)

以上功能在后续篇幅逐一详解,今天就先写到这里。

相关推荐
newxtc2 小时前
【昆明市不动产登记中心-注册安全分析报告】
人工智能·安全
techdashen2 小时前
圆桌讨论:Coding Agent or AI IDE 的现状和未来发展
ide·人工智能
CV实验室3 小时前
TIP 2025 | 哈工大&哈佛等提出 TripleMixer:攻克雨雪雾干扰的3D点云去噪网络!
人工智能·计算机视觉·3d·论文
余俊晖4 小时前
一套针对金融领域多模态问答的自适应多层级RAG框架-VeritasFi
人工智能·金融·rag
码农阿树4 小时前
视频解析转换耗时—OpenCV优化摸索路
人工智能·opencv·音视频
伏小白白白5 小时前
【论文精度-2】求解车辆路径问题的神经组合优化算法:综合展望(Yubin Xiao,2025)
人工智能·算法·机器学习
应用市场5 小时前
OpenCV编程入门:从零开始的计算机视觉之旅
人工智能·opencv·计算机视觉
星域智链6 小时前
宠物智能用品:当毛孩子遇上 AI,是便利还是过度?
人工智能·科技·学习·宠物
taxunjishu6 小时前
DeviceNet 转 MODBUS TCP罗克韦尔 ControlLogix PLC 与上位机在汽车零部件涂装生产线漆膜厚度精准控制的通讯配置案例
人工智能·区块链·工业物联网·工业自动化·总线协议
说私域6 小时前
基于多模态AI技术的传统行业智能化升级路径研究——以开源AI大模型、AI智能名片与S2B2C商城小程序为例
人工智能·小程序·开源