【Stable Diffusion】入门-03:图生图基本步骤+参数解读

目录

  • [1 图生图原理](#1 图生图原理)
  • [2 基本步骤](#2 基本步骤)
    • [2.1 导入图片](#2.1 导入图片)
    • [2.2 书写提示词](#2.2 书写提示词)
    • [2.3 参数调整](#2.3 参数调整)
  • [3 随机种子的含义](#3 随机种子的含义)
  • [4 拓展应用](#4 拓展应用)

1 图生图原理

当提示词不足以表达你的想法,或者你希望以一个更为简单清晰的方式传递一些要求的时候,可以给AI输入一张图片,此时图片和文字是相当的,都是作为一种信息输送给模型,让它拿来生成一张新的图片。模型可以从图片上获取更多的信息,原本的图片上记录的像素信息会在加噪和去噪的过程里被作为一种特征反映到最终的成品上,会让最后成品跟一开始这张图片足够像,给人一种重新绘制的表象。

2 基本步骤

2.1 导入图片

  1. 点击img2img
  2. 点击左下方区域或者直接将图片拖到左下方,上传图片

    在图生图区块下方,有一系列进阶的功能选项。

2.2 书写提示词

图生图也需要提示词,提示词也很重要,按照上一篇博文书写提示词

2.3 参数调整

图生图大部分参数和文生图一样,也有些不同的参数。

  1. Denoising strength:重绘幅度,生成图和原图有多像。如果是一键式生成漫画的方式,推荐0.6~0.8。
  2. 图像分辨率:推荐使用原图的尺寸,如果原始尺寸很大,按比例往下折算到自己的设备能画出来的那个安全区间内,宽高比保持一致。如果想生成其他尺寸比例的图片,推荐先用其他软件裁剪成想要的比例再导入。如果设置的宽高比跟原始的不一样,可能会导致画面的变形。
  3. 图片导入区块下方的几个缩放模式可以帮助裁剪一部分。Just resize (latent upscale) 直接缩放(放大潜变量)不推荐使用,对显存要求很高。

3 随机种子的含义

我们在生成图片时,每次的结果都是不同的。如果我们想要当前生成图的人物形象,只修改背景,那是否能做到呢?

AI生成图片是随机的,但每一次生成都有一套描绘方式,这个描绘方式就会被记录成一组随机数,这就叫做随机种子seed。

不同的随机种子,出来的效果是随机性强的。如果使用同一个随机种子,那生成的图像里就必然会存在很多的相似之处,因为它是用同一套方法随机出来的。

点击骰子,可以把随机参数设置成-1,就是每次都随机生成一个新图。

点击循环按钮,就会把种子设置成你的上一张图片生成的那个种子数。

图库里找到喜欢的图片对应的种子数,复制出来填到随机种子栏里,再通过提示词,把背景的元素加上,就可以保持人物形象不变,只改变背景,最大程度地保持了人物风格的相对一致。

4 拓展应用

  1. 风格转换:将真实人像转成二次元风格,通过修改提示词变换不同的风格。或者将二次元人物真实化。
  2. 拟人化:将不是人像的图片导入,以人物属性的提示词对他进行描述,可以实现静物和风景的拟人化。
  3. 图片细化:通过ps等软件搭建简单的框架,或者乱涂乱画,再借助图生图重绘成炫酷的画面效果。
相关推荐
Ai墨芯1115 小时前
深度学习水论文:特征提取
人工智能·深度学习
SHIPKING3936 小时前
【机器学习&深度学习】LLamaFactory微调效果与vllm部署效果不一致如何解决
人工智能·深度学习·机器学习
闻道且行之6 小时前
Windows|CUDA和cuDNN下载和安装,默认安装在C盘和不安装在C盘的两种方法
windows·深度学习·cuda·cudnn
墨风如雪7 小时前
腾讯混元3D开源:世界生成,正式进入读秒时代
aigc
生医转码,四海为家8 小时前
零基础-动手学深度学习-6.6 卷积神经网络(LeNet)
人工智能·深度学习·cnn
CoovallyAIHub8 小时前
避开算力坑!无人机桥梁检测场景下YOLO模型选型指南
深度学习·算法·计算机视觉
有才不一定有德9 小时前
深入剖析 MetaGPT 中的提示词工程:WriteCode 动作的提示词设计
人工智能·aigc·提示词工程
公谨9 小时前
前端开发者的 AI 突围:从工具使用者到智能交互架构师
aigc
安思派Anspire10 小时前
智能体AI中的提示工程与上下文工程
aigc·openai·agent
iThinkAi10 小时前
最新Coze(扣子)智能体工作流:1分钟生成10条爆款电商商品宣传视频,无需拍摄剪辑
aigc