stable diffusion学习笔记——文生图(二)

LORA和Embeddings都可以对画面内容进行调整。目前LORA主要用来定义画面特征,如具体的人物,衣物,画风等。Embeddings目前主要用于反面提示词中,用来避免错误的画面表现。

LORA

lora的全称为:低秩适应模型。lora的基本用法很简单,首先要将下载好的lora文件存放在特定目录下:

我们先不使用lora,先用基本的提示词生成一张图片:

从生成的图片可以看到,提示词基本上在图片中都得到了体现。

这里提出一个问题,如果我想让特定的角色出现在画面中,怎么办呢?

我们可以使用lora解决这个问题。首先我们在提

只引入lora文件可能不生效,不同的lora需要不同的提示词去触发效果,这里我们将对应的提示词加入到正向提示词里面。

复制代码
souryuu asuka langley  一个lora会有1个以上的提示词

生成的图片可以看到,图片里的人物具备了较多的特定人物特征。

lora的权重通常设置在0.7-1.0之间。设置的值过大会导致画面饱和度以及画面细节失常;设置的值过小会导致特征在图片上不体现。

Embeddings

嵌入式网络目前通常用在负面提示词词条中,用于抑制画面中出现某些特征。比如人物图像中常见的坏手,多肢体等特征可以通过增加嵌入式网络到负面提示词中得以控制。

图中框出的反向词都是嵌入式网络,用于抑制人物的肢体错误。

嵌入式网络存放目录如下

相关推荐
三水不滴7 小时前
Redis 过期删除与内存淘汰机制
数据库·经验分享·redis·笔记·后端·缓存
wdfk_prog8 小时前
[Linux]学习笔记系列 -- [drivers][i2c]i2c-dev
linux·笔记·学习
土拨鼠烧电路8 小时前
笔记03:业务语言速成:“人、货、场”模型与IT系统全景图
笔记
2301_812731419 小时前
CSS3笔记
前端·笔记·css3
越努力越幸运5089 小时前
CSS3学习之网格布局grid
前端·学习·css3
chillxiaohan10 小时前
GO学习记录——多文件调用
开发语言·学习·golang
小乔的编程内容分享站10 小时前
记录使用VSCode调试含scanf()的C语言程序出现的两个问题
c语言·开发语言·笔记·vscode
中屹指纹浏览器11 小时前
2026年指纹浏览器技术迭代与风控对抗演进
经验分享·笔记
1104.北光c°11 小时前
【从零开始学Redis | 第一篇】Redis常用数据结构与基础
java·开发语言·spring boot·redis·笔记·spring·nosql
Funny_AI_LAB11 小时前
AI Agent最新重磅综述:迈向高效智能体,记忆、工具学习和规划综述
人工智能·学习·算法·语言模型·agi