stable diffusion学习笔记——文生图(二)

LORA和Embeddings都可以对画面内容进行调整。目前LORA主要用来定义画面特征,如具体的人物,衣物,画风等。Embeddings目前主要用于反面提示词中,用来避免错误的画面表现。

LORA

lora的全称为:低秩适应模型。lora的基本用法很简单,首先要将下载好的lora文件存放在特定目录下:

我们先不使用lora,先用基本的提示词生成一张图片:

从生成的图片可以看到,提示词基本上在图片中都得到了体现。

这里提出一个问题,如果我想让特定的角色出现在画面中,怎么办呢?

我们可以使用lora解决这个问题。首先我们在提

只引入lora文件可能不生效,不同的lora需要不同的提示词去触发效果,这里我们将对应的提示词加入到正向提示词里面。

souryuu asuka langley  一个lora会有1个以上的提示词

生成的图片可以看到,图片里的人物具备了较多的特定人物特征。

lora的权重通常设置在0.7-1.0之间。设置的值过大会导致画面饱和度以及画面细节失常;设置的值过小会导致特征在图片上不体现。

Embeddings

嵌入式网络目前通常用在负面提示词词条中,用于抑制画面中出现某些特征。比如人物图像中常见的坏手,多肢体等特征可以通过增加嵌入式网络到负面提示词中得以控制。

图中框出的反向词都是嵌入式网络,用于抑制人物的肢体错误。

嵌入式网络存放目录如下

相关推荐
IM_DALLA34 分钟前
【Verilog学习日常】—牛客网刷题—Verilog快速入门—VL16
学习·fpga开发
IM_DALLA35 分钟前
【Verilog学习日常】—牛客网刷题—Verilog快速入门—VL18
学习·fpga开发
完球了37 分钟前
【Day02-JS+Vue+Ajax】
javascript·vue.js·笔记·学习·ajax
怀九日1 小时前
C++(学习)2024.9.19
开发语言·c++·学习·重构·对象·
开MINI的工科男1 小时前
【笔记】自动驾驶预测与决策规划_Part1_自动驾驶决策规划简介
人工智能·笔记·自动驾驶
白帽黑客cst2 小时前
网络安全(黑客技术) 最新三个月学习计划
网络·数据结构·windows·学习·安全·web安全·网络安全
RS&2 小时前
python学习笔记
笔记·python·学习
EterNity_TiMe_3 小时前
【Linux基础IO】深入Linux文件描述符与重定向:解锁高效IO操作的秘密
linux·运维·服务器·学习·性能优化·学习方法
好家伙VCC3 小时前
STM32与51单片机的区别:是否应该直接学习STM32?
stm32·学习·51单片机
liuwill3 小时前
从技术打磨到产品验证:读《程序员修炼之道》的务实之道
笔记·程序人生