AI 绘画 | Stable Diffusion 图生图

图生图简介

Stable Diffusion 不仅可以文生图,还可以图生图。文生图就是完全用提示词文本去生成我们想要图片,但是很多时候会有词不达意的感觉。就像我们房子装修一样,我们只是通过文字描述很难表达出准确的想要的装修效果,如果能给到一张设计图或者效果图,那么就能更加直白的表达我们的想要的意思了。

图生图原理

文生图很难描述出我们对画面一些细节的控制,比如设计场景,我们要对图片中出现的所有事物进行细致的描述,物体的尺寸比例等,这样的提示词非常难写,即使能写出来,AI生图的过程就像在卡牌中抽卡一样,也许很久也抽不到我们想要的那张。于是就有了图生图的功能,我们可在sd web ui里上传一张图片,通过图片文件的方式告诉Ai一些信息,但是仅仅只上传一张图片是不够的。就像你工作的时候,领导给你发了一张图片,然后一句话不说,你也不清楚,领导的意图。还有一点就是,Ai对图片的理解也不是完全没有偏差,所有还要搭配提示词一起使用,才能有更好的效果。

图生图基本步骤

导入图片

选择图图生图,在中间面板中,点击上传或者拖放图片到这里。即可完成图片的导入。

参数设置

图生图和文生图一样,也有迭代步数、采样算法、提示词引导系数、宽高、随机种子等参数设置,不同的是多个一个缩放模式和重绘幅度(尺寸)、还有原来文生图宽高设置的地方改成了重绘幅度和尺幅。感觉文生图的过程更像是在我们上传图片的基础上做的重绘,事实好像确实如此,当我们不写任何提示词,重绘尺寸和原图保持一直,迭代步数设置为2,重绘幅度设置为0时,会得到和原图一模一样的图片

当我们将迭代步数调大设置为20,重绘幅度也调大设置为0.5时,因为我选择的底模是真人大模型,所以生成的图像会趋近于真人。

  • 当迭代步数越大,图像就越趋近于真人且有更多细节变化。
  • 当重绘幅度越大,生成的图像就和原图的相似度越小。


值得说明的是

  • 当我设置重绘尺寸的宽高和原图不一样的时候,画面就被拉伸或者缩短。
  • 图生图不仅可以设置重绘后图片的尺寸(宽高),也可通过重绘倍数去设置,生成的图片是原图等比放大或者缩小的多少倍数。
  • 当我们切换到重绘倍数面板,重绘尺寸失效,就会按照重绘倍数生成。反之当我切换到重绘尺寸,之前设置的重绘倍数就会失效,会按照我们设置重绘的宽高生成。

书写提示词

如果我们像对图片的内容做一些修改,比如让美女的表情发生一些变化,比如让美女微笑,我们只需要在正向提示词输入框里输入smlie 提示词,设置迭代步数是20,重回幅度为0.45,点击生成。

随机种子应用

Stable Diffusion的随机种子(seed)是一个用于生成图像的随机数字,它与其他参数一起被用于驱动扩散过程。**这个随机种子可以确保每次运行模型时,只要输入相同的参数(包括提示词和随机种子),就能得到相同的图像。**换句话说,随机种子可以看作是每个图画的唯一编码。

当随机种子设置为-1时,图画会随机生成。如果用户对生成的图片满意,他们可以复制下面的种子数值,填入随机种子框内,后续生成的图画将与之前的图画相似。

因为Stable Diffusion生成图片每次都是随机的过程,即使相同的提示词和参数设置也会得到不一样的图片,如果我们想要上一次生成的图片上加入一些元素的话,就需要用到随机种子了。

首先点击下这个按钮锁定下上次出图的随机种子,然后在正向提示词输入框内加入,necklace (项链)的提示词,在点击生成就能再上次的图片上将人物带上项链了,前提还要保证除了提示词以外其他参数,包括checkpoint模型保持不变。

图生图扩展应用

图生图还有 涂鸦、局部重绘、涂鸦重绘,蒙版重绘的功能,利用这些功能我们可以将一张原始图片发生很多变化。比如动漫人物变为真人人物、真人变化动漫人物,2d动漫人物变3d动漫人物,3d动漫变2d动漫人物,模特换装,产品场景图等,后面都会讲到,感兴趣的朋友,记得一键三连,你的支持是我更新的动力!!!

相关推荐
了不起的云计算V1 分钟前
2027年信创大考倒计时,联想开天打出“生态+AI”的组合牌
人工智能
财经资讯数据_灵砚智能1 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年4月21日
人工智能·python·信息可视化·自然语言处理·ai编程
电子科技圈4 分钟前
IAR作为Qt Group独立BU携两项重磅汽车电子应用开发方案首秀北京车展
开发语言·人工智能·汽车·软件工程·软件构建·代码规范·设计规范
Axis tech6 分钟前
Xsens:使用惯性动捕技术研究更安全的足球运动训练
人工智能
淹死在鱼塘的程序猿7 分钟前
🚀 告别"一次性聊天":揭秘让 AI 智能体越用越聪明的秘密武器 —— Skills
前端·人工智能·agent
醉卧考场君莫笑19 分钟前
NLP(正向,逆向,双向匹配法分词及代码实现)
人工智能·自然语言处理·easyui
拓朗工控26 分钟前
视觉革命:独立显卡工控机在医疗领域的深度应用
人工智能·智慧医疗·工控机
victory043129 分钟前
2026年4月22日 Malicious Finetuning for LLM via Steganography 解读 复现要点
人工智能
Python私教41 分钟前
Hermes Agent 技能系统:让 AI 学会自我进化
人工智能
小饕43 分钟前
RAG学习之- RAG 数据导入完整指南
人工智能·python·学习