Stable Diffusion AIGC 视觉设计实战教程之 06-提示词应用技巧

正向提示词技巧

正向提示词基础

在 Stable Diffusion 的图像生成过程中，正向提示词书写公式扮演着至关重要的角色。在构建 Stable Diffusion 正向提示词时，主要包含画面内容（主体、动作、道具、环境等）、画面风格、画面构图、通用质量关键词这几部分。

在编写正向提示词时，需要注意基本问题：

使用准确的词汇：尽量使用具体、精确的词汇来描述想要的图像，避免模糊和歧义。
逐步优化：如果第一次生成的图像不符合预期，可以根据结果调整提示词，逐步优化，直到得到满意的图像。
避免过于复杂：虽然使用提示词可以添加很多细节，但提示词过于冗长复杂可能会让模型难以理解，导致生成的图像效果不佳。
符合模型能力：要了解所使用的模型的特点和能力范围，提示词要在模型能够处理的范围内。
尽可能使用英文提示词：一般模型对于英文提示词能更精准地与模型预训练的知识匹配，从而可能生成更符合预期、细节更丰富、风格更纯正的图像。

画面主体

主体决定了图像的中心元素，比如人物、动物、建筑等，当我们只输入主体的提示词时，生成的结果会非常随机，不同风格的模型也会有不同的效果。

以生成一张动物图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：猫
正向提示词（英文）：cat
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

画面动作

动作可以为主体增加动态感，包括肢体动作、表情、人物状态或更加复杂细节的动态等，可以在主体提示词后加上动作详细描述主体的动作，比如跳跃、奔跑、坐着等。

以生成一张动物图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：猫，奔跑，跳跃
正向提示词（英文）：cat,running,jumping
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

画面道具

道具是为主体配备的物品，包括人物的一些特征，可以在动作描述的提示词后面加入描述外观的提示词，如短发、带着耳机、白色衬衫等。

以生成一张动物图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：猫，奔跑，跳跃，胸前挂着铃铛，戴着耳机，戴着眼镜
正向提示词（英文）：Cat,running,jumping,wearing a bell on the chest,wearing headphones,wearing glasses
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

画面环境

环境即主体所处的背景，可以在外观提示词后加入形容环境背景的提示词，如在森林中、城市街头、海边、大草原等。

以生成一张动物图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：猫，奔跑，跳跃，胸前挂着铃铛，戴着耳机，戴着眼镜，在大草原上，蓝天白云
正向提示词（英文）：Cat,running,jumping,with a bell hanging on the chest,wearing headphones,wearing glasses,on the grassland,blue sky with white clouds
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

画面风格

画面风格提示词也是至关重要的，虽然通过更换不同的模型可以更改不同的风格，但很多时候一个模型也可以有多种风格，并可以通过提示词进行风格切换。

以生成一张动物图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：猫，奔跑，跳跃，卡通，动漫卡通，动画风格，平面动漫
正向提示词（英文）：
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

画面构图

构图决定元素的排列方式，如对角线构图、中心构图、广角镜头、长焦镜头等。

以生成一张动物图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：猫，奔跑，跳跃，长焦镜头
正向提示词（英文）：Cat,running,jumping,telephoto lens
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

通用质量提示词

为了提高生成图像的质量，可以加入一些描述画面性质的通用质量提示词。

常用的通用质量提示词：

色彩形容：色彩鲜艳（vibrant colors）、层次丰富（rich layers）、高饱和（high saturation）。
光影自然：完美的灯光（perfect lighting）、自然过渡（natural transitions）、真实感（realism）。
镜头效果：景深（depth of field）、移轴镜头（off-axis lens）、镜头炫光（lens glare）、焦外成像（out of focus imaging）、微距镜头（macro lens）、鱼眼镜头（fisheye lens）、超广角（ultra wide angle）。
质量形容：完美的摄影（perfect photography）、大师级摄影（master level photography）、超高清晰度（ultra-high definition）、超高细节（ultra-high detail）、超高分辨率（ultra-high resolution）、8K 分辨率（8K resolution）。
艺术风格：大师杰作（masterpieces by masters）、具有鲜明个性的艺术作品（works of art with distinct personalities）。
CG 效果：高质量的 CG 作品（high-quality CG works）、逼真的三维渲染（realistic 3D rendering）。

以生成一张食品图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：一个汉堡，产品实拍，深色背景，色彩鲜艳，层次丰富，高饱和，完美的灯光，自然过渡，真实感，景深，完美的摄影，大师级摄影，超高清晰度，超高细节
正向提示词（英文）：a hamburger, product shot, dark background, vibrant colors, rich layers, high saturation, perfect lighting, natural transitions, realism, depth of field, perfect photography, master level photography, ultra-high definition, ultra-high details
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

生成人物 + 场景

以生成一张国风古装女孩在樱花树下跳舞为主题的图像为例。

根据主题，提示词拆分为人物、动作、背景。

人物：一个女孩，穿着古装，华丽的汉服，飘逸的裙摆。
动作：跳舞，轻盈起舞，舞姿优雅。
背景：盛开的樱花，飘落的花瓣。

在正向提示词中明确画面风格与构图。

风格：插画风格，清新，唯美。
构图：全身像，景深镜头。

在正向提示词中调整画面细节与质量。

色彩：色彩鲜艳。
灯光：完美的灯光，柔和，温暖。
画面质量：高清画质，超高分辨率。

提示词组合完毕，调整其他生图参数。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：一个女孩，穿着古装，华丽的汉服，飘逸的裙摆，跳舞，轻盈起舞，舞姿优雅，盛开的樱花，飘落的花瓣，插画风格，清新，唯美，全身像，景深镜头，色彩鲜艳，完美的灯光，柔和，温暖，高清画质，超高分辨率
正向提示词（英文）：A girl,dressed in traditional costume,a magnificent Hanfu,flowing skirt,dancing,light and graceful dance,elegant movements,blooming cherry blossoms,falling petals,illustration style,fresh,beautiful,full shot,depth of field lens,vivid colors,perfect lighting,soft,warm,high definition quality,absurdres
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768
图片数量：4

生成效果：

负向提示词技巧

去除画面中多余的杂物

在 Stable Diffusion 中，负向提示词可以帮助我们去除画面中不想要的元素或杂物，添加特定的负向提示词，可以指导模型在生成图像时避免这些不需要的元素。

改变画面质量

在 Stable Diffusion 中，负向提示词还可以用于改变画面的整体质量，添加与画面质量相关的负向提示词，可以调整画面的清晰度、色彩、光影等。

常用的画面质量类负向提示词：

分辨率与清晰度：低分辨率（lowres）、模糊（blurry）、细节丢失（loss of details）、最差质量（worstquality）。
色彩与对比度：无色（colorless）、色彩暗淡（dull colors）、对比度弱（weak contrast）、色彩平淡（flat colors）、色彩浑浊（muddy colors）
图像瑕疵与伪影：图像嘈杂（noisy image）、伪影（artifacts）、色带（color banding）、锯齿状（jagged edges）、抖动（motion blur artifacts）
渲染问题：渲染伪影（rendering artifacts）、渲染不完整（incomplete rendering）、不自然的光照（unnatural lighting）、阴影问题（shadow issues）、纹理问题（texture problems）
风格与格式：过度风格化（over-stylized）、卡通化（cartoonized）、草图风格（sketch style）、抽象（abstract）、不自然的风格（unnatural style）

提示词优化进阶

提示词选择器

Stable Diffusion 社区开发者提供了提示词标签选择器插件 easy prompt selector（LiblibAI 已内置），可以根据需要快速选择提示词、调整提示词权重，提高提示词编写效率。

保存通用提示词

如果每一次生成图像都需要按照画面书写提示词，还是比较麻烦的，在 Stable Diffusion 中可以提前存储一些通用的提示词，在需要用时直接拿出来，可以减轻提示词编写工作的压力。

先在提示词输入框中，编写正向提示词和负向提示词。

正向提示词：masterpiece, best quality, high resolution, original, ultra-high detail, extremely detailed, perfect lighting, extremely meticulous CG, master level work（杰作，最佳品质，高分辨率，原创，超高细节，极其细致的细节，完美的灯光，极其细致的 CG，大师级作品）
负向提示词：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2), worst quality, low quality, low resolution, monochrome, grayscale, skin blemishes, age spots, ugliness, repetition, pathology, incompleteness, blurriness, poor anatomical structure, poor proportion, disfigurement（Embedding 模型, 质量最差、质量低、分辨率低、单色、灰度、皮肤瑕疵、老年斑、丑陋、重复、病理、不完整、模糊、解剖结构差、比例差、毁容）

编写完成后，保存模板风格，后续只需要在提示词输入框中输入常规提示词，选择保存的模板风格进行生图即可。

提示词权重基础

在 Stable Diffusion 中，提示词权重决定了不同提示词在生成图像时的重要性或影响力，通过调整提示词权重，用户可以更精确地控制图像的生成结果，强调或弱化特定的画面元素、风格或主题。

常用的提示词权重的设置方式：

默认权重与顺序：每个提示词默认权重为 1，提示词的顺序会影响权重，越靠前的提示词权重相对越高。比如"a beautiful landscape, a small house"中，"a beautiful landscape"的权重更高，对生成图像的整体风格和内容影响更大。
小括号加权：使用小括号可提升权重，套一层小括号权重乘以 1.1 倍，比如"(red dress)"，权重变为 1.1 倍。小括号加权最多可套三层，三层小括号权重可达 1.331 倍，即"(((red dress)))"。也可使用"(提示词:数值)"的形式精确控制权重，比如"(red dress:1.5)"将权重提高到 1.5 倍，建议权重值设置在 0.3-1.5 之间。
中括号降权：中括号用于降低权重，套一层中括号权重乘以 0.9 倍，比如"[red dress]"，权重变为 0.9 倍。中括号降权最多可套三层，三层中括号权重为 0.729 倍，即"[[[red dress]]]"。实践中较少使用这种方式降权，通常用小括号加数字的方式更方便，即"(red dress:0.8)"。
大括号加权：大括号可用来增强提示词的权重，一个大括号相当于 1.05 倍权重，如"{red dress}"。大括号加权最多可使用三层，权重可达 1.15 倍，但实际运用中较少使用。
尖括号调用 Lora：尖括号用于调用 Lora，，可以使用 Lora 模型生成更具风格化的图片。
逻辑符号控制："|"用于元素融合，会在两个元素之间循环往复绘制，如"red hair | blue hair"可实现红头发和蓝头发渐变效果，也支持加权"(red hair:1.2)|(blue hair:1.3)"。

调整画面物体比重

以生成一张物品图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：一个红色的苹果，一束粉色的花，苹果在左边，花在右边
正向提示词（英文）：A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768

生成效果：

调整生成参数如下。

正向提示词（中文）：一个红色的苹果，一束粉色的花，苹果在左边，花在右边
正向提示词（英文）：(A red apple:0.7),(a bunch of pink flowers:1.5),the apple on the left,the flowers on the right
随机数种子：1833578644

生成效果：

调整画面风格占比

以生成一张物品图为例，参考生成参数如下。

ckpt 检查点模型：F.1-dev-fp8
正向提示词（中文）：一个红色的苹果，一束粉色的花，苹果在左边，花在右边，水彩风格
正向提示词（英文）：A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right
负向提示词（英文）：ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
采样方法：Euler
迭代步数：30
提示词引导系数：3.5
图片尺寸：1024x768

生成效果：

调整生成参数如下。

正向提示词（中文）：一个红色的苹果，一束粉色的花，苹果在左边，花在右边
正向提示词（英文）：A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right,(watercolor style.:1.7)
随机数种子：1833578644

生成效果：

提示词反推

CLIP 反推

CLIP（Contrastive Language-Image Pretraining）即对比语言-图像预训练模型，是 OpenAI 公司于 2021 年推出的一种多模态模型，能够理解并匹配文本与图像之间的关联。

在 Stable Diffusion 中，CLIP 反推是指通过模型生成的图像来推测其可能的提示词，即可以将图像输入 CLIP 中，然后让 CLIP 直接提供与图像紧密相关的文本描述，帮助我们了解图像的主要特征和风格，但是 CLIP 反推的结果可能不够具体或精确。

使用 CLIP 反推需要在图生图模式下使用，需要先在 Stable Diffusion 中上传需要反推提示词的图像。图像上传完成后，点击 CLIP 反推按钮，等待模型运行后，会自动将反推的提示词输入到正向提示词输入框中。

DeepBooru 反推

DeepBooru 是一个基于深度学习的图像搜索引擎，它能够从大量图像数据集中识别并提取图像的特征，辅助用户生成提示词、进行图像分类检索以及加快数据集标注，但是存在标签准确性有限、粒度可能不符需求以及对图像上下文理解不足等局限。

DeepBooru 反推的使用方式和 CLIP 反推的使用方式大致相同，都需要在图生图模式下使用。

WD =1.4 标签器反推

WD 1.4 标签器是一个专门为 Stable Diffusion 设计的工具，能够帮助我们生成与图像高度相关的标签集合，这些标签可以作为提示词的参考，帮助我们更准确地描述图像的特征和风格。

WD 1.4 更加专注 Stable Diffusion 的上下文，其输出的标签通常与模型生成的图像更加吻合，但其反推结果仍然需要进一步调整和优化，以满足特定的创作需求。

在菜单栏中，可以选择 Tag 反推（Tagger）/ WD 1.4 标签器，上传图像后开始反推。

反推完成后，可以在页面底部卸载所有反推模型，释放显卡内存，提高之后生成图片的效率。

提示词网站分享

无界 AI 咒语生成器

无界 AI 咒语生成器是无界 AI 平台中为用户提供创作启发的特色功能，它设有多种描述维度如人物、色彩、五官等，每个维度下有丰富描述词，支持中文和英文，还提供随机咒语模式，能帮助用户尤其是新手更具体地描述创作需求，从而更轻松地进行 AI 绘画创作。

无界 AI 咒语生成器：https://www.wujieai.com/tag-generator

Promlib 提示词画廊

Promlib 提示词画廊是一个 AI 绘画提示词分享平台，提供用于 AI 绘画（Stable Diffusion 和 Midjourney）的提示词，并且提供该提示词在 AI 绘画中的呈现样式，做为给 AI 绘画爱好者的参考，目前该平台由个人开发者进行开发与维护，致力于把 Promlib 提示词画廊打造最大的 AI 绘画提示词分享平台。

Promlib 提示词画廊：https://promlib.com/

Civitai

Civitai 是一个专注于 AI 图像绘画和艺术作品创作、分享的在线平台和社区，用户可在此上传、分享自己用数据训练的自定义模型及生成的图像，也可浏览、下载模型和他人作品，每张图像会标注所用模型和参数设置，用户还能分享提示词、创作技巧和经验，通过评论、评分和收藏等与其他创作者互动。

Civitai：https://civitai.com/

LiblibAI

LiblibAI 是一个 AI 图像创作绘画平台和模型分享社区，基于 Stable Diffusion 模型提供在线版 WebUI，平台上有 10 万 + AI 模型和创作作品，涵盖多种风格和领域，用户可免费下载或在线使用，平台设有提示词窗口，能帮助用户优化提示词并翻译为英文，方便用户生成高质量图像。

LiblibAI：https://www.liblib.art/