『ComfyUI』提示词语法初学者指南

点赞 + 关注 + 收藏 = 学会了

本文简介

我刚接触 Stable Diffusion 时,最头痛的一点就是不知道怎么写提示词,有时候写出来了但总觉得词不达意。一时间搞不清楚是我表达能力有问题还是AI的理解能力有问题。

其实只要掌握了基本的语法,提示词写起来就不会词不达意了。无非就是词语出现的位置、多几个括号的问题。

基础语法

写 Stable Diffusion 的提示词,建议使用英文书写。现在部分模型是支持中文的,比如快手的 Kolors 。但现在主流的模型还是对英文的支持程度比较好。

比如,我很喜欢的 aniverse 这个模型(模型地址:civitai.com/models/1078...

使用英文输入得到的效果。

复制代码
1girl, ocean, yellow dress

而用中文来输入的话

复制代码
一个女孩,大海,黄色裙子

明显看到,这个模型能理解,但理解得不全。黄色裙子不见了。

所以说,能用英文就尽量用英文吧,毕竟现在的翻译软件那么强大。再不行就把你想绘制的内容告诉 GPT,让 GPT 帮你生成 SD 的提示词。

提示词的权重

提示词的权重,指的是提示词的重要性、分量、比重。

一个提示词的权重越高,它在即将生成的图片中的重要性、细节等要素就越多。

比如我要生成一篇花海,其中蓝色花的权重是1.1,黄色花的权重是0.9。

less 复制代码
sea of flowers, (blue flower:1.1), (yellow flower:0.9)

可以看到,在这个提示词中,蓝色花的重要性比黄色花要高。

而一旦权重的值调转,就会生成一副权重比例完全不一样的图片。

less 复制代码
sea of flowers, (blue flower:0.9), (yellow flower:1.1)

再举个例子,生成一个女孩在花园里,此时女孩的权重是1.2,花园的权重是0.8

scss 复制代码
(1girl:1.2), (garden:0.8)

此时女孩在图片的占比会比花园高,女孩的细节比较丰富,而花园的细节比较粗糙。

而将 garden 改成 1.21girl 改成 0.8,虽然人仍然是主体,但背景花园部分的细节明显比前一张要增多了。

scss 复制代码
(1girl:0.8), (garden:1.2)

控制的权重语法

中括号(降低权重)

中括号代表0.9倍的权重,比如 [Cat] 就等价于 (Cat:0.9)

也就是说,给提示词加上中括号后,提示词的比重会变小,会降低它的重要性。

小括号(增加权重)

小括号代表着1.1倍的权重。比如 (Cat) 就等价于 (Cat:1.1)

给一个提示词加上一个小括号后,那么该提示词在画面中的比重就会增高。

大括号(轻微增加权重)

大括号代表着1.05倍的权重。算是一种微调。比如 {Cat} 等价于 (Cat:1.05)

叠加的括号。

当我们给某个提示词添加2个中括号时,那么就相当于为这个提示词加上了0.9乘以0.9倍的权重。

lua 复制代码
[[Cat]] = (Cat:0.9x0.9) = (Cat:0.81)

那么就相当于给这个提示词加上了0.81倍的权重。

那么同样的,当我们给一个提示词加上2个小括号时,那么就等于1.1乘以1.1倍的权重。也就是1.21。相当于我们给这个提示词加上了1.21倍的权重。

scss 复制代码
((Cat)) = (Cat:1.1x1.1) = (Cat:1.21)

大括号也同理。

权重的快捷键

将光标移动到某个提示词,按住 Ctrl+⬆️,就能给这个提示词增加权重。按Ctrl +⬇️就会减少权重。

需要注意的是,提示词的权重我们设置得多低都行,但不要设置得过高。因为设置得太高的花图片就会出现过度拟合的情况,也就是说可能会出现变形或者失真。

一个个单词拼写是怎么回事?

为什么写提示词的时候,是一个一个单词这样去拼写,而不是用一句话去描述我们想要生成的内容呢?

复制代码
1girl, ocean, yellow dress

一个穿着黄色裙子的女孩在海边

其实两种都行的,但是就目前而言,用一个一个的词组去生成图片的效果会更加的准确。更能表达我们提示词所含的意思。

另外一点,使用一个一个词的时候,也方便我们进行权重的调整。

现在也有很多开发者去研究如何让长句媲美短句的效果,也有一些平台已经支持使用长句生图了,比如 Dall-E3、Meta ai、文心一言等。但出来的效果还是一般般。

提示词的整体长度

输入提示词的时候,并不是越多越好。太啰嗦的话 AI 会觉得你喝醉酒,它也会跟着喝醉,生图效果可能会变得更糟糕。

经过众多玩家的经验以及研究表明,最好把提示词的数量控制在75个以内,这样出来的效果是最精准的。

起手式

什么是起手式呢?

在SD各个大模型训练中,会加入许多如4K、8K或者masterpiece各种各样高质量的图形去训练。

那么当我们在输入提示词的时候,比方说 4K masterpiece,那么就可以使我们生成的图像更加精美。

反向提示词也一样。比如我们输入 blur(模糊),就是不想要模糊嘛。相当于也会让生成出来的图片更加清晰。

提示词的顺序

提示词的书写顺序对权重是有一点点影响的。

arduino 复制代码
text, text, cat

cat, text, text

在一组权重一样的提示词中(没有增加各种括号调整权重),越靠前的提示词权重会有所增加。

在我们书写提示词的时候,我们尽量按照如下格式进行书写。

  1. 画质词/画风词,首先输入可以提升画质或者改变画风的词汇(比如:masterpiece、high quality、heig detail)
  2. 主体,描述画面的主体(1girl、blue dress)
  3. 环境/场景/构图,描写环境场景灯光或者构图(garden、white background、soft light)
  4. lora(关于loar和相关模型下载,之后的教程会讲解)

以上就是本文的全部内容啦,想了解更多 ComfyUI 使用方法的工友,欢迎关注 👉 ComfyUI 中文教程

相关推荐
凯子坚持 c1 小时前
从 0 到 1:ComfyUI AI 工作流抠图构建全实践
大数据·人工智能
背太阳的牧羊人2 小时前
OpenAI Embedding 和密集检索(如 BERT/DPR)进行语义相似度搜索有什么区别和联系
人工智能·bert·embedding
光与电子KOYUELEC加油奋斗3 小时前
Molex莫仕连接器:增强高级驾驶辅助系统,打造更安全的汽车
人工智能·光与电子
__lost5 小时前
MATLAB画出3d的常见复杂有机分子和矿物的分子结构
开发语言·人工智能·matlab·化学·分子结构
每天都要写算法(努力版)5 小时前
【神经网络与深度学习】五折交叉验证(5-Fold Cross-Validation)
人工智能·深度学习·神经网络
VI8664956I265 小时前
基于AIGC的3D场景生成实战:从文本描述到虚拟世界构建
3d·aigc
郭不耐5 小时前
DeepSeek智能时空数据分析(六):大模型NL2SQL绘制城市之间连线
人工智能·数据分析·时序数据库·数据可视化·deepseek
winfredzhang6 小时前
Deepseek 生成新玩法:从文本到可下载 Word 文档?思路与实践
人工智能·word·deepseek
KY_chenzhao7 小时前
ChatGPT与DeepSeek在科研论文撰写中的整体科研流程与案例解析
人工智能·机器学习·chatgpt·论文·科研·deepseek
不爱吃于先生7 小时前
生成对抗网络(Generative Adversarial Nets,GAN)
人工智能·神经网络·生成对抗网络