StableDiffusionWebUI 入门笔记

SD 安装、下载 Anything 模型、安装汉化扩展。。。

模型分类:大模型、微调模型

文生图

面板介绍

提示词,反向提示词,按钮组

图片生成配置

采样方法:有很多种采样器可以选择,采样器就是通过去除图像噪声,生成随机图像并重复几次这个过程得到干净的图像。去噪的方法有很多种。通常需要在速度和准确性之间做出权衡。

迭代次数:去噪次数。随着增加,图片细节越丰富,但可能改变图片风格。通常为 20~30

宽度与高度:修改这两项可能改变图片内容。调大后需要更多的显存

单批次数:每一批几个图,调高后需要的显存更大

总批次:一共几批

提示词引导系数:对于提示词的重视程度,越低生成图片偏离提示词的概率就越大,越高生成图片的线条就越重。通常在 7~15

随机数种子:会影响图片的构图。其后三个按钮分别是:随机种子、回收种子、差异随机种子

  • 差异随机种子:将另一张图片与当前图片进行融合然后生成新的图片

模型选择页面。其中【模型】页是指大模型,其他三个【嵌入式、超网络和Lora】是指微调模型页

生成图片区域。展示生成的图片、图片操作按钮组、图片生成提示等信息

脚本

提示词矩阵

提示词模板:名词|adj_1|adj_2[|ajd_x[|adjy...]]

提示词:1girl|japanese_clothes|Strapless dress|office|homeware

脚本 =》选择提示词矩阵

产生提示词组合的图片

提示词组合举例

另一个示例:1girl|red hair|blue hair|yellow hair

从文件中读取提示词参数

一个示例脚本

css 复制代码
--prompt "a girl,red hair" --steps 20

编写脚本规则:

  1. 生成以行为单位,一行就是一次生成
  2. 参数格式为:--参数名称 参数值
  3. 参数之间需要使用英文空格进行分割
  4. 字符串的数值需要引用英文引号将内容括起来

常见的参数配置说明

几个官方示例

X/Y/Z 图标

可以展示不同采样器在不同采样次数下的对比图

一个示例:a girl,blue hair,black skirt,white shirt

结果:

图生图

有六个页卡,可分为三大类:

  • 图生图、涂鸦
  • 局部重绘,涂鸦重绘,上传重绘模板
  • 批量处理

图生图

相比于文生图 多了两个参数:缩放模式重绘幅度

缩放模式:解决上传图片的宽高和生成图片宽高比例不一致的问题

重绘幅度:数值越小图像就越接近原图,越大与原图的差异就越大,合适范围:0.5~0.75

涂鸦

图生图 功能一致,唯一的区别就是可以在图片上进行涂鸦

可以利用此功能辅助 AI 构图,划分出不同内容的色块,这样可以大大提高出图成功率

局部重绘

在生成图片时遇到一张很不错的图片,但图片在细节上存在很大的瑕疵甚至错误。对于这种情况,可以使用局部重绘对问题进行处理。

局部重绘有三个页卡,区别在于对蒙版的不同使用方式:

局部重绘大体步骤:

  1. 上传图片
  2. 绘图以确定蒙版区域
  3. 对蒙版区域进行预处理。目的是让蒙版区域颜色更加贴近想要生成结果的颜色,颜色越贴近修补的成功率就越高
  4. 对蒙版区域进行模糊处理。上一步直接填入的颜色可能会比较生硬,所以需要通过模糊将颜色柔和化,进而产生一个颜色过渡的效果,便于后期去噪处理,提高出图成功率
  5. 去噪,迭代生成图片

局部重绘功能多了个参数

  1. 蒙版边缘模糊度
  1. 蒙版模式:告诉 AI 重画的区域,是蒙版区域还是蒙版以外的区域

  2. 蒙版区域内容处理:表示蒙版内容的预处理方式

  3. 重绘区域:

    1. 整张图片:表示图片修复完成后将整张图片的宽高进行调整
    2. 仅蒙版区域:只对蒙版区域进行重绘,可以处理高分辨率图片,不用设置宽高
  4. 仅蒙版区域下边缘预留像素:表示像素密度,一般来说密度越高内容越多,但是

    1. 如果密度高且区域小,可能会出现图中图的问题。
    2. 如果修改的区域较大,对于高密度填充,蒙版区域内的内容更加完善;低密度填充,可能会因为去噪过程使图片变化较小
    3. 该选项与蒙版区域大小有很大关系,需要多尝试找出最佳选择

补充:以填充潜变量噪声为例对像素密度进行调整

手涂蒙版

在蒙版上涂鸦颜色,涂鸦的颜色可以辅助 AI 绘画

如果涂鸦的颜色过重或修改区域的边缘与原图差异较大,可以调节一下蒙版透明度

上传重绘蒙版

不同局部重绘存在的问题:

  1. 鼠标不容易精准涂抹问题区域
  2. 一次性蒙版无法留存

使用重绘上传蒙版

  1. 蒙版为黑白颜色,白色代表蒙版选择区域
  2. 保留一些对于问题区域的间隔

图:使用 PS 制作蒙版,需保留一些对于问题区域的间隔

脚本

SD upscale

原理:将原图拆分后分别放大,然后再拼接起来

选择该脚本后只需选择放大算法即可

注意:此时需要选择【重绘幅度】范围为 0.2~0.4,太大会造成混乱

回送

空降,不常用

图生图的替代性测试

一个示例:将图片中女孩的头发变为另一种颜色

空降

向外扩展

两种方法:

  • 旧方法类似局部重绘
  • 新方法:默认使用扩张区域使用噪声填充,多了两个新参数

图片信息获取

反推提示词

上传图片后使用两种提示词反推方法,区别:

  • CLIP反推:针对写实风格
  • DeepBooru反推:针对动漫风格

注意:第一次使用时要下载模型,需要科学上网

根据图片获取当时使用的生成参数

需要设置:

验证:只需上传图片就可以得到生成时使用的参数信息

图生图批量处理

常见用途:批量处理图片生成动画

放大图片

有三种方式:单文件、多文件、批量处理文件夹

缩放模式:

放大算法:有两种可选,大小决定了放大算法2的强度。通常只用设置算法1就够了

勾选未显示在下拉列表中的算法:

比较各算法处理动漫图片的效果。。。推荐【R-ESRGAN 4x+ Anime6B】

GFPGAN 与 CodeFormer:真人面部的修复算法。对动漫图片修复无效果

  • GFPGAN:在原图的基础上进行处理,处理后的结果更接近原图
  • CodeFormer:会对原图的内容进行补充,有时补充的效果是画蛇添足的,比较适合处理问题不大的图片

www.bilibili.com/video/BV1qk...

相关推荐
池央14 分钟前
AI性能极致体验:通过阿里云平台高效调用满血版DeepSeek-R1模型
人工智能·阿里云·云计算
我们的五年15 分钟前
DeepSeek 和 ChatGPT 在特定任务中的表现:逻辑推理与创意生成
人工智能·chatgpt·ai作画·deepseek
Yan-英杰16 分钟前
百度搜索和文心智能体接入DeepSeek满血版——AI搜索的新纪元
图像处理·人工智能·python·深度学习·deepseek
Fuweizn17 分钟前
富唯智能可重构柔性装配产线:以智能协同赋能制造业升级
人工智能·智能机器人·复合机器人
taoqick2 小时前
对PosWiseFFN的改进: MoE、PKM、UltraMem
人工智能·pytorch·深度学习
suibian52352 小时前
AI时代:前端开发的职业发展路径拓宽
前端·人工智能
预测模型的开发与应用研究3 小时前
数据分析的AI+流程(个人经验)
人工智能·数据挖掘·数据分析
源大模型3 小时前
OS-Genesis:基于逆向任务合成的 GUI 代理轨迹自动化生成
人工智能·gpt·智能体
PowerBI学谦5 小时前
Python in Excel高级分析:一键RFM分析
大数据·人工智能·pandas
运维开发王义杰5 小时前
AI: Unsloth + Llama 3 微调实践,基于Colab
人工智能·llama