AI 绘画 | Stable Diffusion 图生图

图生图简介

Stable Diffusion 不仅可以文生图,还可以图生图。文生图就是完全用提示词文本去生成我们想要图片,但是很多时候会有词不达意的感觉。就像我们房子装修一样,我们只是通过文字描述很难表达出准确的想要的装修效果,如果能给到一张设计图或者效果图,那么就能更加直白的表达我们的想要的意思了。

图生图原理

文生图很难描述出我们对画面一些细节的控制,比如设计场景,我们要对图片中出现的所有事物进行细致的描述,物体的尺寸比例等,这样的提示词非常难写,即使能写出来,AI生图的过程就像在卡牌中抽卡一样,也许很久也抽不到我们想要的那张。于是就有了图生图的功能,我们可在sd web ui里上传一张图片,通过图片文件的方式告诉Ai一些信息,但是仅仅只上传一张图片是不够的。就像你工作的时候,领导给你发了一张图片,然后一句话不说,你也不清楚,领导的意图。还有一点就是,Ai对图片的理解也不是完全没有偏差,所有还要搭配提示词一起使用,才能有更好的效果。

图生图基本步骤

导入图片

选择图图生图,在中间面板中,点击上传或者拖放图片到这里。即可完成图片的导入。

参数设置

图生图和文生图一样,也有迭代步数、采样算法、提示词引导系数、宽高、随机种子等参数设置,不同的是多个一个缩放模式和重绘幅度(尺寸)、还有原来文生图宽高设置的地方改成了重绘幅度和尺幅。感觉文生图的过程更像是在我们上传图片的基础上做的重绘,事实好像确实如此,当我们不写任何提示词,重绘尺寸和原图保持一直,迭代步数设置为2,重绘幅度设置为0时,会得到和原图一模一样的图片

当我们将迭代步数调大设置为20,重绘幅度也调大设置为0.5时,因为我选择的底模是真人大模型,所以生成的图像会趋近于真人。

  • 当迭代步数越大,图像就越趋近于真人且有更多细节变化。
  • 当重绘幅度越大,生成的图像就和原图的相似度越小。


值得说明的是

  • 当我设置重绘尺寸的宽高和原图不一样的时候,画面就被拉伸或者缩短。
  • 图生图不仅可以设置重绘后图片的尺寸(宽高),也可通过重绘倍数去设置,生成的图片是原图等比放大或者缩小的多少倍数。
  • 当我们切换到重绘倍数面板,重绘尺寸失效,就会按照重绘倍数生成。反之当我切换到重绘尺寸,之前设置的重绘倍数就会失效,会按照我们设置重绘的宽高生成。

书写提示词

如果我们像对图片的内容做一些修改,比如让美女的表情发生一些变化,比如让美女微笑,我们只需要在正向提示词输入框里输入smlie 提示词,设置迭代步数是20,重回幅度为0.45,点击生成。

随机种子应用

Stable Diffusion的随机种子(seed)是一个用于生成图像的随机数字,它与其他参数一起被用于驱动扩散过程。**这个随机种子可以确保每次运行模型时,只要输入相同的参数(包括提示词和随机种子),就能得到相同的图像。**换句话说,随机种子可以看作是每个图画的唯一编码。

当随机种子设置为-1时,图画会随机生成。如果用户对生成的图片满意,他们可以复制下面的种子数值,填入随机种子框内,后续生成的图画将与之前的图画相似。

因为Stable Diffusion生成图片每次都是随机的过程,即使相同的提示词和参数设置也会得到不一样的图片,如果我们想要上一次生成的图片上加入一些元素的话,就需要用到随机种子了。

首先点击下这个按钮锁定下上次出图的随机种子,然后在正向提示词输入框内加入,necklace (项链)的提示词,在点击生成就能再上次的图片上将人物带上项链了,前提还要保证除了提示词以外其他参数,包括checkpoint模型保持不变。

图生图扩展应用

图生图还有 涂鸦、局部重绘、涂鸦重绘,蒙版重绘的功能,利用这些功能我们可以将一张原始图片发生很多变化。比如动漫人物变为真人人物、真人变化动漫人物,2d动漫人物变3d动漫人物,3d动漫变2d动漫人物,模特换装,产品场景图等,后面都会讲到,感兴趣的朋友,记得一键三连,你的支持是我更新的动力!!!

相关推荐
xiaoxiaoxiaolll1 小时前
期刊速递 | 《Light Sci. Appl.》超宽带光热电机理研究,推动碳纳米管传感器在制药质控中的实际应用
人工智能·学习
练习两年半的工程师1 小时前
AWS TechFest 2025: 风险模型的转变、流程设计的转型、生成式 AI 从实验走向实施的三大关键要素、评估生成式 AI 用例的适配度
人工智能·科技·金融·aws
DisonTangor2 小时前
字节开源 OneReward: 通过多任务人类偏好学习实现统一掩模引导的图像生成
学习·ai作画·开源·aigc
Elastic 中国社区官方博客4 小时前
Elasticsearch:智能搜索的 MCP
大数据·人工智能·elasticsearch·搜索引擎·全文检索
stbomei4 小时前
从“能说话”到“会做事”:AI Agent如何重构日常工作流?
人工智能
yzx9910134 小时前
生活在数字世界:一份人人都能看懂的网络安全生存指南
运维·开发语言·网络·人工智能·自动化
许泽宇的技术分享5 小时前
LangGraph深度解析:构建下一代智能Agent的架构革命——从Pregel到现代AI工作流的技术飞跃
人工智能·架构
乔巴先生245 小时前
LLMCompiler:基于LangGraph的并行化Agent架构高效实现
人工智能·python·langchain·人机交互
weiwei228446 小时前
文生图模型Stable Diffusion使用详解
stable diffusion·文生图
静西子7 小时前
LLM大语言模型部署到本地(个人总结)
人工智能·语言模型·自然语言处理