【Stable Diffusion】入门-03:图生图基本步骤+参数解读

目录

  • [1 图生图原理](#1 图生图原理)
  • [2 基本步骤](#2 基本步骤)
    • [2.1 导入图片](#2.1 导入图片)
    • [2.2 书写提示词](#2.2 书写提示词)
    • [2.3 参数调整](#2.3 参数调整)
  • [3 随机种子的含义](#3 随机种子的含义)
  • [4 拓展应用](#4 拓展应用)

1 图生图原理

当提示词不足以表达你的想法,或者你希望以一个更为简单清晰的方式传递一些要求的时候,可以给AI输入一张图片,此时图片和文字是相当的,都是作为一种信息输送给模型,让它拿来生成一张新的图片。模型可以从图片上获取更多的信息,原本的图片上记录的像素信息会在加噪和去噪的过程里被作为一种特征反映到最终的成品上,会让最后成品跟一开始这张图片足够像,给人一种重新绘制的表象。

2 基本步骤

2.1 导入图片

  1. 点击img2img
  2. 点击左下方区域或者直接将图片拖到左下方,上传图片

    在图生图区块下方,有一系列进阶的功能选项。

2.2 书写提示词

图生图也需要提示词,提示词也很重要,按照上一篇博文书写提示词

2.3 参数调整

图生图大部分参数和文生图一样,也有些不同的参数。

  1. Denoising strength:重绘幅度,生成图和原图有多像。如果是一键式生成漫画的方式,推荐0.6~0.8。
  2. 图像分辨率:推荐使用原图的尺寸,如果原始尺寸很大,按比例往下折算到自己的设备能画出来的那个安全区间内,宽高比保持一致。如果想生成其他尺寸比例的图片,推荐先用其他软件裁剪成想要的比例再导入。如果设置的宽高比跟原始的不一样,可能会导致画面的变形。
  3. 图片导入区块下方的几个缩放模式可以帮助裁剪一部分。Just resize (latent upscale) 直接缩放(放大潜变量)不推荐使用,对显存要求很高。

3 随机种子的含义

我们在生成图片时,每次的结果都是不同的。如果我们想要当前生成图的人物形象,只修改背景,那是否能做到呢?

AI生成图片是随机的,但每一次生成都有一套描绘方式,这个描绘方式就会被记录成一组随机数,这就叫做随机种子seed。

不同的随机种子,出来的效果是随机性强的。如果使用同一个随机种子,那生成的图像里就必然会存在很多的相似之处,因为它是用同一套方法随机出来的。

点击骰子,可以把随机参数设置成-1,就是每次都随机生成一个新图。

点击循环按钮,就会把种子设置成你的上一张图片生成的那个种子数。

图库里找到喜欢的图片对应的种子数,复制出来填到随机种子栏里,再通过提示词,把背景的元素加上,就可以保持人物形象不变,只改变背景,最大程度地保持了人物风格的相对一致。

4 拓展应用

  1. 风格转换:将真实人像转成二次元风格,通过修改提示词变换不同的风格。或者将二次元人物真实化。
  2. 拟人化:将不是人像的图片导入,以人物属性的提示词对他进行描述,可以实现静物和风景的拟人化。
  3. 图片细化:通过ps等软件搭建简单的框架,或者乱涂乱画,再借助图生图重绘成炫酷的画面效果。
相关推荐
GISer_Jing44 分钟前
AI:多智能体协作与记忆管理
人工智能·设计模式·aigc
Yeats_Liao1 小时前
MindSpore开发之路(二十五):融入开源:如何为MindSpore社区贡献力量
人工智能·分布式·深度学习·机器学习·华为·开源
Blossom.1181 小时前
Transformer架构优化实战:从MHA到MQA/GQA的显存革命
人工智能·python·深度学习·react.js·架构·aigc·transformer
小明_GLC2 小时前
Falcon-TST: A Large-Scale Time Series Foundation Model
论文阅读·人工智能·深度学习·transformer
棒棒的皮皮2 小时前
【深度学习】YOLO模型精度优化 Checklist
人工智能·深度学习·yolo·计算机视觉
微尘hjx2 小时前
【数据集 01】家庭室内烟火数据集(按比例划分训练、验证、测试)包含训练好的yolo11/yolov8模型
深度学习·yolov8·yolo11·训练模型·烟火数据集·家庭火灾数据集·火灾数据集
高洁012 小时前
CLIP 的双编码器架构是如何优化图文关联的?(2)
python·深度学习·机器学习·知识图谱
koo3643 小时前
pytorch深度学习笔记9
pytorch·笔记·深度学习
拌面jiang3 小时前
过拟合--Overfitting(#拌面)
人工智能·深度学习·机器学习
桂花饼3 小时前
基于第三方中转的高效 Sora-2 接口集成方案
人工智能·aigc·ai视频生成·gemini 3 pro·gpt-5.2·ai绘画4k·sora_video2