AI绘画软件Stable Diffusion详解教程(7):图生图基础篇

我们在使用AI魔盒不停的绘制一幅幅图像时,会有这样的疑问:为什么生成的图像随机性这么强?我们如何按照自己的构图创作作品?为什么提示词生成的图像细节不够?如何把手绘的风格转换成另一种风格,或者说把自己的照片转换成另一种风格?

以上问题除了可以通过lora、controlnet等微调模型来实现,我们还可以通过图生图来解决,微调模型相对复杂,我们先来学习一下图生图。图生图的标签在下图箭头处:

图生图中又有不同的绘图功能,本篇主要讲一部分基础功能和常见参数设置。

一、图生图(img2img)的参数

图生图的工作方式与文生图有所不同,文生图直接通过噪声产生图像,而图生图是图像和噪声一起结合运算的结果,其原理是在一副初始图的基础上添加噪点,然后根据提示词扩散去噪,最后形成新的图像。)

1.重绘强度

添加的噪声量取决于重绘幅度参数,该参数的范围从0到1,0表示不添加噪声,生成的图像和原图像相同,而1表示完全用噪声替换图像,实质上等同于文生图。

原图:(使用DreamShaperXL基础模型绘制):

重绘幅度为0:(使用revAnimated基础模型绘制)

重绘幅度为0.3:

重绘幅度为0.5:

重绘幅度为0.7:

可以看出,重绘幅度到0.7的时候和原图的偏离度已经很大了。

2.提示词引导系数(CFG Scale)

和文生图一样,提示词引导系数非常重要,参数越大,提示词强度越强,生成的图像就越符合提示词的要求,但一般不超过20,以避免过度依赖提示词导致图像失去多样性。

3.缩放模式

(1)拉伸

此模式仅调整图片大小,会导致图片变形,结果如下:

(2)裁剪

会根据新的尺寸截掉多余的部分。

(3)填充

看起来和原图一样,但是像素变大了一倍。可以用于扩充图像的像素,此方法最常用,比如用于修复不清晰的照片。

(4)直接缩放

和第(1)中拉伸效果相同,只不过用的不同的算法来实现,图像质量一般还不如第一种。

二、图生图其它面板参数

1.涂鸦绘制(Sketch)

2.局部绘制(Inpaint)

3.局部绘制(涂鸦蒙版)(Inpaint sketch)

4.局部绘制(上传蒙版)(Inpaint upload)

5.批量处理(Batch)

以上功能在后续篇幅逐一详解,今天就先写到这里。

相关推荐
zhuiyisuifeng1 小时前
2026前瞻:GPTimage2镜像官网或将颠覆视觉创作
人工智能·gpt
徐健峰1 小时前
GPT-image-2 热门玩法实战(一):AI 看手相 — 一张手掌照片生成专业手相分析图
人工智能·gpt
weixin_370976351 小时前
AI的终极赛跑:进入AGI,还是泡沫破灭?
大数据·人工智能·agi
Slow菜鸟1 小时前
AI学习篇(五) | awesome-design-md 使用说明
人工智能·学习
冬奇Lab2 小时前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐2 小时前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴2 小时前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek
狐狐生风2 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
波动几何2 小时前
CDA架构代码工坊技能cda-code-lab
人工智能
舟遥遥娓飘飘2 小时前
DeepSeek V4技术变革对社会结构与职业体系的重构
人工智能