SD 安装、下载 Anything 模型、安装汉化扩展。。。
模型分类:大模型、微调模型
文生图
面板介绍
提示词,反向提示词,按钮组
图片生成配置
采样方法:有很多种采样器可以选择,采样器就是通过去除图像噪声,生成随机图像并重复几次这个过程得到干净的图像。去噪的方法有很多种。通常需要在速度和准确性之间做出权衡。
迭代次数:去噪次数。随着增加,图片细节越丰富,但可能改变图片风格。通常为 20~30
宽度与高度:修改这两项可能改变图片内容。调大后需要更多的显存
单批次数:每一批几个图,调高后需要的显存更大
总批次:一共几批
提示词引导系数:对于提示词的重视程度,越低生成图片偏离提示词的概率就越大,越高生成图片的线条就越重。通常在 7~15
随机数种子:会影响图片的构图。其后三个按钮分别是:随机种子、回收种子、差异随机种子
- 差异随机种子:将另一张图片与当前图片进行融合然后生成新的图片
模型选择页面。其中【模型】页是指大模型,其他三个【嵌入式、超网络和Lora】是指微调模型页
生成图片区域。展示生成的图片、图片操作按钮组、图片生成提示等信息
脚本
提示词矩阵
提示词模板:名词|adj_1|adj_2[|ajd_x[|adjy...]]
提示词:1girl|japanese_clothes|Strapless dress|office|homeware
脚本 =》选择提示词矩阵
产生提示词组合的图片
提示词组合举例
另一个示例:1girl|red hair|blue hair|yellow hair
从文件中读取提示词参数
一个示例脚本
css
--prompt "a girl,red hair" --steps 20
编写脚本规则:
- 生成以行为单位,一行就是一次生成
- 参数格式为:
--参数名称 参数值
- 参数之间需要使用英文空格进行分割
- 字符串的数值需要引用英文引号将内容括起来
常见的参数配置说明
X/Y/Z 图标
可以展示不同采样器在不同采样次数下的对比图
一个示例:a girl,blue hair,black skirt,white shirt
结果:
图生图
有六个页卡,可分为三大类:
- 图生图、涂鸦
- 局部重绘,涂鸦重绘,上传重绘模板
- 批量处理
图生图
相比于文生图 多了两个参数:缩放模式 和重绘幅度
缩放模式:解决上传图片的宽高和生成图片宽高比例不一致的问题
重绘幅度:数值越小图像就越接近原图,越大与原图的差异就越大,合适范围:0.5~0.75
涂鸦
与图生图 功能一致,唯一的区别就是可以在图片上进行涂鸦
可以利用此功能辅助 AI 构图,划分出不同内容的色块,这样可以大大提高出图成功率
局部重绘
在生成图片时遇到一张很不错的图片,但图片在细节上存在很大的瑕疵甚至错误。对于这种情况,可以使用局部重绘对问题进行处理。
局部重绘有三个页卡,区别在于对蒙版的不同使用方式:
局部重绘大体步骤:
- 上传图片
- 绘图以确定蒙版区域
- 对蒙版区域进行预处理。目的是让蒙版区域颜色更加贴近想要生成结果的颜色,颜色越贴近修补的成功率就越高
- 对蒙版区域进行模糊处理。上一步直接填入的颜色可能会比较生硬,所以需要通过模糊将颜色柔和化,进而产生一个颜色过渡的效果,便于后期去噪处理,提高出图成功率
- 去噪,迭代生成图片
局部重绘功能多了五个参数
- 蒙版边缘模糊度
-
蒙版模式:告诉 AI 重画的区域,是蒙版区域还是蒙版以外的区域
-
蒙版区域内容处理:表示蒙版内容的预处理方式
-
重绘区域:
- 整张图片:表示图片修复完成后将整张图片的宽高进行调整
- 仅蒙版区域:只对蒙版区域进行重绘,可以处理高分辨率图片,不用设置宽高
-
仅蒙版区域下边缘预留像素:表示像素密度,一般来说密度越高内容越多,但是
- 如果密度高且区域小,可能会出现图中图的问题。
- 如果修改的区域较大,对于高密度填充,蒙版区域内的内容更加完善;低密度填充,可能会因为去噪过程使图片变化较小
- 该选项与蒙版区域大小有很大关系,需要多尝试找出最佳选择
补充:以填充潜变量噪声为例对像素密度进行调整
手涂蒙版
在蒙版上涂鸦颜色,涂鸦的颜色可以辅助 AI 绘画
如果涂鸦的颜色过重或修改区域的边缘与原图差异较大,可以调节一下蒙版透明度
上传重绘蒙版
不同局部重绘存在的问题:
- 鼠标不容易精准涂抹问题区域
- 一次性蒙版无法留存
使用重绘上传蒙版
- 蒙版为黑白颜色,白色代表蒙版选择区域
- 保留一些对于问题区域的间隔
图:使用 PS 制作蒙版,需保留一些对于问题区域的间隔
脚本
SD upscale
原理:将原图拆分后分别放大,然后再拼接起来
选择该脚本后只需选择放大算法即可
注意:此时需要选择【重绘幅度】范围为 0.2~0.4,太大会造成混乱
回送
空降,不常用
图生图的替代性测试
一个示例:将图片中女孩的头发变为另一种颜色
向外扩展
两种方法:
- 旧方法类似局部重绘
- 新方法:默认使用扩张区域使用噪声填充,多了两个新参数
图片信息获取
反推提示词
上传图片后使用两种提示词反推方法,区别:
- CLIP反推:针对写实风格
- DeepBooru反推:针对动漫风格
注意:第一次使用时要下载模型,需要科学上网
根据图片获取当时使用的生成参数
需要设置:
验证:只需上传图片就可以得到生成时使用的参数信息
图生图批量处理
常见用途:批量处理图片生成动画
放大图片
有三种方式:单文件、多文件、批量处理文件夹
缩放模式:
放大算法:有两种可选,大小决定了放大算法2的强度。通常只用设置算法1就够了
勾选未显示在下拉列表中的算法:
比较各算法处理动漫图片的效果。。。推荐【R-ESRGAN 4x+ Anime6B】
GFPGAN 与 CodeFormer:真人面部的修复算法。对动漫图片修复无效果
- GFPGAN:在原图的基础上进行处理,处理后的结果更接近原图
- CodeFormer:会对原图的内容进行补充,有时补充的效果是画蛇添足的,比较适合处理问题不大的图片