【Stable Diffusion】入门-03:图生图基本步骤+参数解读

目录

  • [1 图生图原理](#1 图生图原理)
  • [2 基本步骤](#2 基本步骤)
    • [2.1 导入图片](#2.1 导入图片)
    • [2.2 书写提示词](#2.2 书写提示词)
    • [2.3 参数调整](#2.3 参数调整)
  • [3 随机种子的含义](#3 随机种子的含义)
  • [4 拓展应用](#4 拓展应用)

1 图生图原理

当提示词不足以表达你的想法,或者你希望以一个更为简单清晰的方式传递一些要求的时候,可以给AI输入一张图片,此时图片和文字是相当的,都是作为一种信息输送给模型,让它拿来生成一张新的图片。模型可以从图片上获取更多的信息,原本的图片上记录的像素信息会在加噪和去噪的过程里被作为一种特征反映到最终的成品上,会让最后成品跟一开始这张图片足够像,给人一种重新绘制的表象。

2 基本步骤

2.1 导入图片

  1. 点击img2img
  2. 点击左下方区域或者直接将图片拖到左下方,上传图片

    在图生图区块下方,有一系列进阶的功能选项。

2.2 书写提示词

图生图也需要提示词,提示词也很重要,按照上一篇博文书写提示词

2.3 参数调整

图生图大部分参数和文生图一样,也有些不同的参数。

  1. Denoising strength:重绘幅度,生成图和原图有多像。如果是一键式生成漫画的方式,推荐0.6~0.8。
  2. 图像分辨率:推荐使用原图的尺寸,如果原始尺寸很大,按比例往下折算到自己的设备能画出来的那个安全区间内,宽高比保持一致。如果想生成其他尺寸比例的图片,推荐先用其他软件裁剪成想要的比例再导入。如果设置的宽高比跟原始的不一样,可能会导致画面的变形。
  3. 图片导入区块下方的几个缩放模式可以帮助裁剪一部分。Just resize (latent upscale) 直接缩放(放大潜变量)不推荐使用,对显存要求很高。

3 随机种子的含义

我们在生成图片时,每次的结果都是不同的。如果我们想要当前生成图的人物形象,只修改背景,那是否能做到呢?

AI生成图片是随机的,但每一次生成都有一套描绘方式,这个描绘方式就会被记录成一组随机数,这就叫做随机种子seed。

不同的随机种子,出来的效果是随机性强的。如果使用同一个随机种子,那生成的图像里就必然会存在很多的相似之处,因为它是用同一套方法随机出来的。

点击骰子,可以把随机参数设置成-1,就是每次都随机生成一个新图。

点击循环按钮,就会把种子设置成你的上一张图片生成的那个种子数。

图库里找到喜欢的图片对应的种子数,复制出来填到随机种子栏里,再通过提示词,把背景的元素加上,就可以保持人物形象不变,只改变背景,最大程度地保持了人物风格的相对一致。

4 拓展应用

  1. 风格转换:将真实人像转成二次元风格,通过修改提示词变换不同的风格。或者将二次元人物真实化。
  2. 拟人化:将不是人像的图片导入,以人物属性的提示词对他进行描述,可以实现静物和风景的拟人化。
  3. 图片细化:通过ps等软件搭建简单的框架,或者乱涂乱画,再借助图生图重绘成炫酷的画面效果。
相关推荐
进取星辰1 小时前
PyTorch 深度学习实战(23):多任务强化学习(Multi-Task RL)之扩展
人工智能·pytorch·深度学习
盼小辉丶1 小时前
TensorFlow深度学习实战——基于循环神经网络的文本生成模型
rnn·深度学习·tensorflow
FL16238631291 小时前
水污染检测数据集VOC+YOLO格式2487张4类别
深度学习·yolo·机器学习
redparrot20082 小时前
LeNet5 神经网络的参数解析和图片尺寸解析
人工智能·深度学习·神经网络
deephub3 小时前
SecMulti-RAG:兼顾数据安全与智能检索的多源RAG框架,为企业构建不泄密的智能搜索引擎
人工智能·深度学习·大语言模型·rag·智能检索
滴水成川3 小时前
基于 BERT 微调一个意图识别(Intent Classification)模型
人工智能·深度学习·bert
layneyao3 小时前
AI艺术创作:Midjourney、Stable Diffusion与商业变现
人工智能·stable diffusion·midjourney
亲持红叶4 小时前
transformer-实现单层Decoder 层
人工智能·深度学习·transformer
孙先生1484 小时前
AIGC重构元宇宙:从内容生成到沉浸式体验的技术革命
人工智能·aigc
Want5954 小时前
DeepSeek破界而来:重构大规模深度检索的算力与边界
人工智能·重构·aigc