stable diffusion学习笔记——文生图(二)

LORA和Embeddings都可以对画面内容进行调整。目前LORA主要用来定义画面特征,如具体的人物,衣物,画风等。Embeddings目前主要用于反面提示词中,用来避免错误的画面表现。

LORA

lora的全称为:低秩适应模型。lora的基本用法很简单,首先要将下载好的lora文件存放在特定目录下:

我们先不使用lora,先用基本的提示词生成一张图片:

从生成的图片可以看到,提示词基本上在图片中都得到了体现。

这里提出一个问题,如果我想让特定的角色出现在画面中,怎么办呢?

我们可以使用lora解决这个问题。首先我们在提

只引入lora文件可能不生效,不同的lora需要不同的提示词去触发效果,这里我们将对应的提示词加入到正向提示词里面。

复制代码
souryuu asuka langley  一个lora会有1个以上的提示词

生成的图片可以看到,图片里的人物具备了较多的特定人物特征。

lora的权重通常设置在0.7-1.0之间。设置的值过大会导致画面饱和度以及画面细节失常;设置的值过小会导致特征在图片上不体现。

Embeddings

嵌入式网络目前通常用在负面提示词词条中,用于抑制画面中出现某些特征。比如人物图像中常见的坏手,多肢体等特征可以通过增加嵌入式网络到负面提示词中得以控制。

图中框出的反向词都是嵌入式网络,用于抑制人物的肢体错误。

嵌入式网络存放目录如下

相关推荐
果果燕6 分钟前
今日学习笔记:双向链表、循环链表、栈
笔记·学习·链表
觉醒大王14 分钟前
AI写的青基中了
人工智能·笔记·深度学习·学习·职场和发展·学习方法
明月醉窗台23 分钟前
qt使用笔记六之 Qt Creator、Qt Widgets、Qt Quick 详细解析
开发语言·笔记·qt
驱动探索者43 分钟前
linux mailbox 学习
linux·学习·算法
进阶小白猿1 小时前
Java技术八股学习Day33
java·开发语言·学习
收菜福星1 小时前
当AI Agent成为大学标配:2026年学习模式的深层变革
人工智能·学习
蒟蒻的贤1 小时前
yolo12结构学习
学习
●VON2 小时前
CANN推理引擎:从云端到边缘的极致加速与部署实战
学习·react native
笔画人生2 小时前
深度解析 CANN 项目:以 `ops-transformer` 为例探索高性能 AI 算子库
学习·开源
AI视觉网奇3 小时前
3d数字人 ue blender 绑定衣服对齐 2026
学习·ue5