Stable Diffusion 笔记 : 多模型混用操作方式记录

👈👈👈 欢迎点赞收藏关注哟

首先分享之前的所有文章 >>>> 😜😜😜
文章合集 : 🎁 juejin.cn/post/694164...
Github : 👉 github.com/black-ant
CASE 备份 : 👉 gitee.com/antblack/ca...

一. 前言

上一篇文章 里面主要是基础用法 ,这一篇深入一下模型的混合使用。

二. 模型混用方式

上一篇了解到模型主要分为以下几种 :

  • LoRA :通常用于人物和概念,体积小且控图效果好,常用于固定角色特征
  • Checkpoint : 体积较大,用于控制画风
  • Embedding : 适用于控制画风和人物,相对速度中等
  • Dreambooth : 可以用于人物,概念和画风,对配置要求较高

而国内资源网站上面比较多的是 LORACheckPoint

现在假设我对一个资源模型不太满意了,那么就需要混用多个模型 :

2.1 常规混用 :增加 VAE

  • VAE : 全名 Variational autoenconder,中文叫变分自编码器
  • 效果 :一般情况下挂载 VAE 可以起到一个滤镜 + 微调的效果,对颜色和线条产生影响
  • 目的 : VAE 的目的并不是为了做滤镜,只是因为可以产生一定滤镜的效果
    • 根本作用在于将图像转换到更小的潜在空间 ,加速计算的过程
    • 从潜在空间中更好地解码图像后 ,可以让细微的细节更加完善
  • 使用 : 一般情况下下载 VAE 丢在对应文件夹就能使用
    • 大部分模型都内置了 VAE ,我们可以使用更高版本的,或者覆盖其中的效果
  • 区分 : VAE 分为 EMA 和 MSE 两种
    • EMA : 生成更清晰的图像
    • MSE : 生成的图像更平滑
  • 不知道在上传的图片有没有压缩,应该能猜的到,中间这个就是没有加 VAE 外挂模型的
  • 右边那个颜色明显更加丰富一些

问题一 : VAE 外挂模型应该怎么找 ?

问题二 : VAE 模型放在哪里 ?

放在 \sd-webui-aki\sd-webui-aki-v4.2\models\VAE 路径下 ,然后主界面刷新下即可。

问题三 : VAE 模型有没有负效果 ?

通常情况下 ,部分类型的模型本身就细节很丰富,这类模型是不需要通过 VAE 加持的。

相反,这些模型有时候还需要通过降低鲜艳度的一些 VAE 来削弱这种效果。

2.2 同时使用多个模型

这种方式通常是一个 CHECKPOINT 大模型和多个 Lora 模型进行组合使用。 通过 CHECKPOINT 控制大方向 ,然后通过 Lora 模型进行微调和控制。

使用方式也很简单,当把 Lora 模型放在对应文件夹后 ,就可以在正向词中使用 :

  • S1 : 把模型加载到 Lora 目录下 : \sd-webui-aki\sd-webui-aki-v4.2\models\Lora
  • S2 : 在生成模型的时候加入 lora 包
  • 👉👉👉下面这图就是最后的效果 ,不用我说应该都知道哪个是加了多个模型的吧

问题一 : 怎么提前知道合并的效果 ?

以 liblib 里面的模型为例 ,当我们点开一个效果图的时候 ,有一些里面是会告诉你他使用了那些模型 :

2.3 融合模型 :多个模型复合使用并且权重排序

使用方式 :

这里简单的总结以下内容 :

  • 最多可以三个模型相融合
  • 融合比例 : 即 A/B 两个模型在最终模型里面占的比例值 (A * (1 - M) + B * M
  • 融合算法 : 具体的原理没弄懂,使用 加权和 就完事了
  • 模型格式 : 最后输出的模型的格式,一般可以通过文件后缀体现处理
  • 复制配置文件 :
  • 嵌入 VAE 模型 : 就像我们上面说的,可以通过 VAE 模型来控制最后的细节
  • 删除匹配键名的表达式的权重 : 可以删除模型里面的某个元素,让后续的模型不会使用该元素

使用过程记录 :

  • 融合很快 ,融合完成后会在右边提升输出的路径
  • 对内存要求高 ,内存不够会直接报错的,个人本地测试,复杂的就不尝试了
  • 融合后的和正常的模型一样使用就行了

总结

这里就算是彻底入门了, AIGC 未来可能会影响到我们生活的方方面面。

有的时候学习这些不一定是为了赚钱,更大的原因是为了不被时代抛弃。

后面有空了,会尝试进行模型训练。

参考文档

关于Stable Diffusion中的VAE使用 - 知乎 (zhihu.com)

相关推荐
LucianaiB6 分钟前
我用飞书多维表做了一个 AI 活动推荐智能体:每天自动催我别错过截止日期!
后端
蔡俊锋7 分钟前
把1500个业务的大迁移,做成了可复用流水线用 Skill+Agent+Rule,省下 60 人年的实战复盘
人工智能·skill+agent
ZGi.ai8 分钟前
AI中台和AI工具的区别:为什么说前者是基础设施而后者是应用
人工智能·chatgpt·ai工具·ai基础设施
飘落的数码折腾日记14 分钟前
OpenClaw 是什么?让 AI 真正 “动手“ 帮你干活的秘密武器
人工智能
fthux20 分钟前
用了 GitZip 这么多年,我动手做了一个「Pro」版
人工智能·开源·github
Zik----21 分钟前
DAEFR (ICLR 2024)— 盲脸超分模型解读
人工智能·python·高光谱图像·光谱恢复
TheRouter25 分钟前
Agent Harness系列(三):记忆层的3种持久化架构——从SQLite到向量库
人工智能·架构·sqlite·llm·ai-native
一切皆是因缘际会32 分钟前
从概率生成到内生心智:2026大模型瓶颈与下一代AI演进方向
人工智能·安全·ai·架构
X54先生(人文科技)36 分钟前
《元创力》纪实录·心田记釉下新声:当《纪·念》成为可聆听的星轨
人工智能·开源·ai写作·开源协议
CeshirenTester38 分钟前
字节面试官追问:“你的Agent调了三个工具就死循环了,异常处理在哪写的?”我:啊?还要写这个?
人工智能