正向提示词技巧
正向提示词基础
在 Stable Diffusion 的图像生成过程中,正向提示词书写公式扮演着至关重要的角色。在构建 Stable Diffusion 正向提示词时,主要包含画面内容(主体、动作、道具、环境等)、画面风格、画面构图、通用质量关键词这几部分。
在编写正向提示词时,需要注意基本问题:
- 使用准确的词汇:尽量使用具体、精确的词汇来描述想要的图像,避免模糊和歧义。
- 逐步优化:如果第一次生成的图像不符合预期,可以根据结果调整提示词,逐步优化,直到得到满意的图像。
- 避免过于复杂:虽然使用提示词可以添加很多细节,但提示词过于冗长复杂可能会让模型难以理解,导致生成的图像效果不佳。
- 符合模型能力:要了解所使用的模型的特点和能力范围,提示词要在模型能够处理的范围内。
- 尽可能使用英文提示词:一般模型对于英文提示词能更精准地与模型预训练的知识匹配,从而可能生成更符合预期、细节更丰富、风格更纯正的图像。
画面主体
主体决定了图像的中心元素,比如人物、动物、建筑等,当我们只输入主体的提示词时,生成的结果会非常随机,不同风格的模型也会有不同的效果。
以生成一张动物图为例,参考生成参数如下。
-
ckpt 检查点模型:F.1-dev-fp8
-
正向提示词(中文):猫
-
正向提示词(英文):cat
-
负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
-
采样方法:Euler
-
迭代步数:30
-
提示词引导系数:3.5
-
图片尺寸:1024x768
-
图片数量:4
生成效果:




画面动作
动作可以为主体增加动态感,包括肢体动作、表情、人物状态或更加复杂细节的动态等,可以在主体提示词后加上动作详细描述主体的动作,比如跳跃、奔跑、坐着等。
以生成一张动物图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):猫,奔跑,跳跃
- 正向提示词(英文):cat,running,jumping
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
- 图片数量:4
生成效果:




画面道具
道具是为主体配备的物品,包括人物的一些特征,可以在动作描述的提示词后面加入描述外观的提示词,如短发、带着耳机、白色衬衫等。
以生成一张动物图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):猫,奔跑,跳跃,胸前挂着铃铛,戴着耳机,戴着眼镜
- 正向提示词(英文):Cat,running,jumping,wearing a bell on the chest,wearing headphones,wearing glasses
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
- 图片数量:4
生成效果:




画面环境
环境即主体所处的背景,可以在外观提示词后加入形容环境背景的提示词,如在森林中、城市街头、海边、大草原等。
以生成一张动物图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):猫,奔跑,跳跃,胸前挂着铃铛,戴着耳机,戴着眼镜,在大草原上,蓝天白云
- 正向提示词(英文):Cat,running,jumping,with a bell hanging on the chest,wearing headphones,wearing glasses,on the grassland,blue sky with white clouds
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
- 图片数量:4
生成效果:




画面风格
画面风格提示词也是至关重要的,虽然通过更换不同的模型可以更改不同的风格,但很多时候一个模型也可以有多种风格,并可以通过提示词进行风格切换。
以生成一张动物图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):猫,奔跑,跳跃,卡通,动漫卡通,动画风格,平面动漫
- 正向提示词(英文):
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
- 图片数量:4
生成效果:




画面构图
构图决定元素的排列方式,如对角线构图、中心构图、广角镜头、长焦镜头等。
以生成一张动物图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):猫,奔跑,跳跃,长焦镜头
- 正向提示词(英文):Cat,running,jumping,telephoto lens
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
- 图片数量:4
生成效果:




通用质量提示词
为了提高生成图像的质量,可以加入一些描述画面性质的通用质量提示词。
常用的通用质量提示词:
- 色彩形容:色彩鲜艳(vibrant colors)、层次丰富(rich layers)、高饱和(high saturation)。
- 光影自然:完美的灯光(perfect lighting)、自然过渡(natural transitions)、真实感(realism)。
- 镜头效果:景深(depth of field)、移轴镜头(off-axis lens)、镜头炫光(lens glare)、焦外成像(out of focus imaging)、微距镜头(macro lens)、鱼眼镜头(fisheye lens)、超广角(ultra wide angle)。
- 质量形容:完美的摄影(perfect photography)、大师级摄影(master level photography)、超高清晰度(ultra-high definition)、超高细节(ultra-high detail)、超高分辨率(ultra-high resolution)、8K 分辨率(8K resolution)。
- 艺术风格:大师杰作(masterpieces by masters)、具有鲜明个性的艺术作品(works of art with distinct personalities)。
- CG 效果:高质量的 CG 作品(high-quality CG works)、逼真的三维渲染(realistic 3D rendering)。
以生成一张食品图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):一个汉堡,产品实拍,深色背景,色彩鲜艳,层次丰富,高饱和,完美的灯光,自然过渡,真实感,景深,完美的摄影,大师级摄影,超高清晰度,超高细节
- 正向提示词(英文):a hamburger, product shot, dark background, vibrant colors, rich layers, high saturation, perfect lighting, natural transitions, realism, depth of field, perfect photography, master level photography, ultra-high definition, ultra-high details
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
- 图片数量:4
生成效果:




生成人物 + 场景
以生成一张国风古装女孩在樱花树下跳舞为主题的图像为例。
根据主题,提示词拆分为人物、动作、背景。
- 人物:一个女孩,穿着古装,华丽的汉服,飘逸的裙摆。
- 动作:跳舞,轻盈起舞,舞姿优雅。
- 背景:盛开的樱花,飘落的花瓣。
在正向提示词中明确画面风格与构图。
- 风格:插画风格,清新,唯美。
- 构图:全身像,景深镜头。
在正向提示词中调整画面细节与质量。
- 色彩:色彩鲜艳。
- 灯光:完美的灯光,柔和,温暖。
- 画面质量:高清画质,超高分辨率。
提示词组合完毕,调整其他生图参数。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):一个女孩,穿着古装,华丽的汉服,飘逸的裙摆,跳舞,轻盈起舞,舞姿优雅,盛开的樱花,飘落的花瓣,插画风格,清新,唯美,全身像,景深镜头,色彩鲜艳,完美的灯光,柔和,温暖,高清画质,超高分辨率
- 正向提示词(英文):A girl,dressed in traditional costume,a magnificent Hanfu,flowing skirt,dancing,light and graceful dance,elegant movements,blooming cherry blossoms,falling petals,illustration style,fresh,beautiful,full shot,depth of field lens,vivid colors,perfect lighting,soft,warm,high definition quality,absurdres
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
- 图片数量:4
生成效果:




负向提示词技巧
去除画面中多余的杂物
在 Stable Diffusion 中,负向提示词可以帮助我们去除画面中不想要的元素或杂物,添加特定的负向提示词,可以指导模型在生成图像时避免这些不需要的元素。
改变画面质量
在 Stable Diffusion 中,负向提示词还可以用于改变画面的整体质量,添加与画面质量相关的负向提示词,可以调整画面的清晰度、色彩、光影等。
常用的画面质量类负向提示词:
-
分辨率与清晰度:低分辨率(lowres)、模糊(blurry)、细节丢失(loss of details)、最差质量(worstquality)。
-
色彩与对比度:无色(colorless)、色彩暗淡(dull colors)、对比度弱(weak contrast)、色彩平淡(flat colors)、色彩浑浊(muddy colors)
-
图像瑕疵与伪影:图像嘈杂(noisy image)、伪影(artifacts)、色带(color banding)、锯齿状(jagged edges)、抖动(motion blur artifacts)
-
渲染问题:渲染伪影(rendering artifacts)、渲染不完整(incomplete rendering)、不自然的光照(unnatural lighting)、阴影问题(shadow issues)、纹理问题(texture problems)
-
风格与格式:过度风格化(over-stylized)、卡通化(cartoonized)、草图风格(sketch style)、抽象(abstract)、不自然的风格(unnatural style)
提示词优化进阶
提示词选择器
Stable Diffusion 社区开发者提供了提示词标签选择器插件 easy prompt selector(LiblibAI 已内置),可以根据需要快速选择提示词、调整提示词权重,提高提示词编写效率。

保存通用提示词
如果每一次生成图像都需要按照画面书写提示词,还是比较麻烦的,在 Stable Diffusion 中可以提前存储一些通用的提示词,在需要用时直接拿出来,可以减轻提示词编写工作的压力。
先在提示词输入框中,编写正向提示词和负向提示词。
- 正向提示词:masterpiece, best quality, high resolution, original, ultra-high detail, extremely detailed, perfect lighting, extremely meticulous CG, master level work(杰作,最佳品质,高分辨率,原创,超高细节,极其细致的细节,完美的灯光,极其细致的 CG,大师级作品)
- 负向提示词:ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2), worst quality, low quality, low resolution, monochrome, grayscale, skin blemishes, age spots, ugliness, repetition, pathology, incompleteness, blurriness, poor anatomical structure, poor proportion, disfigurement(Embedding 模型, 质量最差、质量低、分辨率低、单色、灰度、皮肤瑕疵、老年斑、丑陋、重复、病理、不完整、模糊、解剖结构差、比例差、毁容)
编写完成后,保存模板风格,后续只需要在提示词输入框中输入常规提示词,选择保存的模板风格进行生图即可。

提示词权重基础
在 Stable Diffusion 中,提示词权重决定了不同提示词在生成图像时的重要性或影响力,通过调整提示词权重,用户可以更精确地控制图像的生成结果,强调或弱化特定的画面元素、风格或主题。
常用的提示词权重的设置方式:
- 默认权重与顺序:每个提示词默认权重为 1,提示词的顺序会影响权重,越靠前的提示词权重相对越高。比如"a beautiful landscape, a small house"中,"a beautiful landscape"的权重更高,对生成图像的整体风格和内容影响更大。
- 小括号加权:使用小括号可提升权重,套一层小括号权重乘以 1.1 倍,比如"(red dress)",权重变为 1.1 倍。小括号加权最多可套三层,三层小括号权重可达 1.331 倍,即"(((red dress)))"。也可使用"(提示词:数值)"的形式精确控制权重,比如"(red dress:1.5)"将权重提高到 1.5 倍,建议权重值设置在 0.3-1.5 之间。
- 中括号降权:中括号用于降低权重,套一层中括号权重乘以 0.9 倍,比如"[red dress]",权重变为 0.9 倍。中括号降权最多可套三层,三层中括号权重为 0.729 倍,即"[[[red dress]]]"。实践中较少使用这种方式降权,通常用小括号加数字的方式更方便,即"(red dress:0.8)"。
- 大括号加权:大括号可用来增强提示词的权重,一个大括号相当于 1.05 倍权重,如"{red dress}"。大括号加权最多可使用三层,权重可达 1.15 倍,但实际运用中较少使用。
- 尖括号调用 Lora:尖括号用于调用 Lora,,可以使用 Lora 模型生成更具风格化的图片。
- 逻辑符号控制:"|"用于元素融合,会在两个元素之间循环往复绘制,如"red hair | blue hair"可实现红头发和蓝头发渐变效果,也支持加权"(red hair:1.2)|(blue hair:1.3)"。
调整画面物体比重
以生成一张物品图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边
- 正向提示词(英文):A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
生成效果:

调整生成参数如下。
- 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边
- 正向提示词(英文):(A red apple:0.7),(a bunch of pink flowers:1.5),the apple on the left,the flowers on the right
- 随机数种子:1833578644
生成效果:

调整画面风格占比
以生成一张物品图为例,参考生成参数如下。
- ckpt 检查点模型:F.1-dev-fp8
- 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边,水彩风格
- 正向提示词(英文):A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right
- 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
- 采样方法:Euler
- 迭代步数:30
- 提示词引导系数:3.5
- 图片尺寸:1024x768
生成效果:

调整生成参数如下。
- 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边
- 正向提示词(英文):A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right,(watercolor style.:1.7)
- 随机数种子:1833578644
生成效果:

提示词反推
CLIP 反推
CLIP(Contrastive Language-Image Pretraining)即对比语言-图像预训练模型,是 OpenAI 公司于 2021 年推出的一种多模态模型,能够理解并匹配文本与图像之间的关联。
在 Stable Diffusion 中,CLIP 反推是指通过模型生成的图像来推测其可能的提示词,即可以将图像输入 CLIP 中,然后让 CLIP 直接提供与图像紧密相关的文本描述,帮助我们了解图像的主要特征和风格,但是 CLIP 反推的结果可能不够具体或精确。
使用 CLIP 反推需要在图生图模式下使用,需要先在 Stable Diffusion 中上传需要反推提示词的图像。图像上传完成后,点击 CLIP 反推按钮,等待模型运行后,会自动将反推的提示词输入到正向提示词输入框中。

DeepBooru 反推
DeepBooru 是一个基于深度学习的图像搜索引擎,它能够从大量图像数据集中识别并提取图像的特征,辅助用户生成提示词、进行图像分类检索以及加快数据集标注,但是存在标签准确性有限、粒度可能不符需求以及对图像上下文理解不足等局限。
DeepBooru 反推的使用方式和 CLIP 反推的使用方式大致相同,都需要在图生图模式下使用。
WD =1.4 标签器反推
WD 1.4 标签器是一个专门为 Stable Diffusion 设计的工具,能够帮助我们生成与图像高度相关的标签集合,这些标签可以作为提示词的参考,帮助我们更准确地描述图像的特征和风格。
WD 1.4 更加专注 Stable Diffusion 的上下文,其输出的标签通常与模型生成的图像更加吻合,但其反推结果仍然需要进一步调整和优化,以满足特定的创作需求。
在菜单栏中,可以选择 Tag 反推(Tagger)/ WD 1.4 标签器,上传图像后开始反推。

反推完成后,可以在页面底部卸载所有反推模型,释放显卡内存,提高之后生成图片的效率。
提示词网站分享
无界 AI 咒语生成器
无界 AI 咒语生成器是无界 AI 平台中为用户提供创作启发的特色功能,它设有多种描述维度如人物、色彩、五官等,每个维度下有丰富描述词,支持中文和英文,还提供随机咒语模式,能帮助用户尤其是新手更具体地描述创作需求,从而更轻松地进行 AI 绘画创作。
无界 AI 咒语生成器:https://www.wujieai.com/tag-generator

Promlib 提示词画廊
Promlib 提示词画廊是一个 AI 绘画提示词分享平台,提供用于 AI 绘画(Stable Diffusion 和 Midjourney)的提示词,并且提供该提示词在 AI 绘画中的呈现样式,做为给 AI 绘画爱好者的参考,目前该平台由个人开发者进行开发与维护,致力于把 Promlib 提示词画廊打造最大的 AI 绘画提示词分享平台。
Promlib 提示词画廊:https://promlib.com/

Civitai
Civitai 是一个专注于 AI 图像绘画和艺术作品创作、分享的在线平台和社区,用户可在此上传、分享自己用数据训练的自定义模型及生成的图像,也可浏览、下载模型和他人作品,每张图像会标注所用模型和参数设置,用户还能分享提示词、创作技巧和经验,通过评论、评分和收藏等与其他创作者互动。
Civitai:https://civitai.com/

LiblibAI
LiblibAI 是一个 AI 图像创作绘画平台和模型分享社区,基于 Stable Diffusion 模型提供在线版 WebUI,平台上有 10 万 + AI 模型和创作作品,涵盖多种风格和领域,用户可免费下载或在线使用,平台设有提示词窗口,能帮助用户优化提示词并翻译为英文,方便用户生成高质量图像。
LiblibAI:https://www.liblib.art/
