StableDiffusionWebUI 入门笔记

SD 安装、下载 Anything 模型、安装汉化扩展。。。

模型分类:大模型、微调模型

文生图

面板介绍

提示词,反向提示词,按钮组

图片生成配置

采样方法:有很多种采样器可以选择,采样器就是通过去除图像噪声,生成随机图像并重复几次这个过程得到干净的图像。去噪的方法有很多种。通常需要在速度和准确性之间做出权衡。

迭代次数:去噪次数。随着增加,图片细节越丰富,但可能改变图片风格。通常为 20~30

宽度与高度:修改这两项可能改变图片内容。调大后需要更多的显存

单批次数:每一批几个图,调高后需要的显存更大

总批次:一共几批

提示词引导系数:对于提示词的重视程度,越低生成图片偏离提示词的概率就越大,越高生成图片的线条就越重。通常在 7~15

随机数种子:会影响图片的构图。其后三个按钮分别是:随机种子、回收种子、差异随机种子

  • 差异随机种子:将另一张图片与当前图片进行融合然后生成新的图片

模型选择页面。其中【模型】页是指大模型,其他三个【嵌入式、超网络和Lora】是指微调模型页

生成图片区域。展示生成的图片、图片操作按钮组、图片生成提示等信息

脚本

提示词矩阵

提示词模板:名词|adj_1|adj_2[|ajd_x[|adjy...]]

提示词:1girl|japanese_clothes|Strapless dress|office|homeware

脚本 =》选择提示词矩阵

产生提示词组合的图片

提示词组合举例

另一个示例:1girl|red hair|blue hair|yellow hair

从文件中读取提示词参数

一个示例脚本

css 复制代码
--prompt "a girl,red hair" --steps 20

编写脚本规则:

  1. 生成以行为单位,一行就是一次生成
  2. 参数格式为:--参数名称 参数值
  3. 参数之间需要使用英文空格进行分割
  4. 字符串的数值需要引用英文引号将内容括起来

常见的参数配置说明

几个官方示例

X/Y/Z 图标

可以展示不同采样器在不同采样次数下的对比图

一个示例:a girl,blue hair,black skirt,white shirt

结果:

图生图

有六个页卡,可分为三大类:

  • 图生图、涂鸦
  • 局部重绘,涂鸦重绘,上传重绘模板
  • 批量处理

图生图

相比于文生图 多了两个参数:缩放模式重绘幅度

缩放模式:解决上传图片的宽高和生成图片宽高比例不一致的问题

重绘幅度:数值越小图像就越接近原图,越大与原图的差异就越大,合适范围:0.5~0.75

涂鸦

图生图 功能一致,唯一的区别就是可以在图片上进行涂鸦

可以利用此功能辅助 AI 构图,划分出不同内容的色块,这样可以大大提高出图成功率

局部重绘

在生成图片时遇到一张很不错的图片,但图片在细节上存在很大的瑕疵甚至错误。对于这种情况,可以使用局部重绘对问题进行处理。

局部重绘有三个页卡,区别在于对蒙版的不同使用方式:

局部重绘大体步骤:

  1. 上传图片
  2. 绘图以确定蒙版区域
  3. 对蒙版区域进行预处理。目的是让蒙版区域颜色更加贴近想要生成结果的颜色,颜色越贴近修补的成功率就越高
  4. 对蒙版区域进行模糊处理。上一步直接填入的颜色可能会比较生硬,所以需要通过模糊将颜色柔和化,进而产生一个颜色过渡的效果,便于后期去噪处理,提高出图成功率
  5. 去噪,迭代生成图片

局部重绘功能多了个参数

  1. 蒙版边缘模糊度
  1. 蒙版模式:告诉 AI 重画的区域,是蒙版区域还是蒙版以外的区域

  2. 蒙版区域内容处理:表示蒙版内容的预处理方式

  3. 重绘区域:

    1. 整张图片:表示图片修复完成后将整张图片的宽高进行调整
    2. 仅蒙版区域:只对蒙版区域进行重绘,可以处理高分辨率图片,不用设置宽高
  4. 仅蒙版区域下边缘预留像素:表示像素密度,一般来说密度越高内容越多,但是

    1. 如果密度高且区域小,可能会出现图中图的问题。
    2. 如果修改的区域较大,对于高密度填充,蒙版区域内的内容更加完善;低密度填充,可能会因为去噪过程使图片变化较小
    3. 该选项与蒙版区域大小有很大关系,需要多尝试找出最佳选择

补充:以填充潜变量噪声为例对像素密度进行调整

手涂蒙版

在蒙版上涂鸦颜色,涂鸦的颜色可以辅助 AI 绘画

如果涂鸦的颜色过重或修改区域的边缘与原图差异较大,可以调节一下蒙版透明度

上传重绘蒙版

不同局部重绘存在的问题:

  1. 鼠标不容易精准涂抹问题区域
  2. 一次性蒙版无法留存

使用重绘上传蒙版

  1. 蒙版为黑白颜色,白色代表蒙版选择区域
  2. 保留一些对于问题区域的间隔

图:使用 PS 制作蒙版,需保留一些对于问题区域的间隔

脚本

SD upscale

原理:将原图拆分后分别放大,然后再拼接起来

选择该脚本后只需选择放大算法即可

注意:此时需要选择【重绘幅度】范围为 0.2~0.4,太大会造成混乱

回送

空降,不常用

图生图的替代性测试

一个示例:将图片中女孩的头发变为另一种颜色

空降

向外扩展

两种方法:

  • 旧方法类似局部重绘
  • 新方法:默认使用扩张区域使用噪声填充,多了两个新参数

图片信息获取

反推提示词

上传图片后使用两种提示词反推方法,区别:

  • CLIP反推:针对写实风格
  • DeepBooru反推:针对动漫风格

注意:第一次使用时要下载模型,需要科学上网

根据图片获取当时使用的生成参数

需要设置:

验证:只需上传图片就可以得到生成时使用的参数信息

图生图批量处理

常见用途:批量处理图片生成动画

放大图片

有三种方式:单文件、多文件、批量处理文件夹

缩放模式:

放大算法:有两种可选,大小决定了放大算法2的强度。通常只用设置算法1就够了

勾选未显示在下拉列表中的算法:

比较各算法处理动漫图片的效果。。。推荐【R-ESRGAN 4x+ Anime6B】

GFPGAN 与 CodeFormer:真人面部的修复算法。对动漫图片修复无效果

  • GFPGAN:在原图的基础上进行处理,处理后的结果更接近原图
  • CodeFormer:会对原图的内容进行补充,有时补充的效果是画蛇添足的,比较适合处理问题不大的图片

www.bilibili.com/video/BV1qk...

相关推荐
算家云4 分钟前
快速识别模型:simple_ocr,部署教程
开发语言·人工智能·python·ocr·数字识别·检测模型·英文符号识别
youcans_36 分钟前
【微软:多模态基础模型】(5)多模态大模型:通过LLM训练
人工智能·计算机视觉·大模型·大语言模型·多模态
飞凌嵌入式39 分钟前
飞凌嵌入式T113-i开发板RISC-V核的实时应用方案
人工智能·嵌入式硬件·嵌入式·risc-v·飞凌嵌入式
sinovoip41 分钟前
Banana Pi BPI-CanMV-K230D-Zero 采用嘉楠科技 K230D RISC-V芯片设计
人工智能·科技·物联网·开源·risc-v
搏博1 小时前
神经网络问题之一:梯度消失(Vanishing Gradient)
人工智能·机器学习
z千鑫1 小时前
【人工智能】深入理解PyTorch:从0开始完整教程!全文注解
人工智能·pytorch·python·gpt·深度学习·ai编程
YRr YRr1 小时前
深度学习:神经网络的搭建
人工智能·深度学习·神经网络
威桑1 小时前
CMake + mingw + opencv
人工智能·opencv·计算机视觉
爱喝热水的呀哈喽1 小时前
torch张量与函数表达式写法
人工智能·pytorch·深度学习