Stable Diffusion AIGC 视觉设计实战教程之 06-提示词应用技巧

正向提示词技巧

正向提示词基础

在 Stable Diffusion 的图像生成过程中,正向提示词书写公式扮演着至关重要的角色。在构建 Stable Diffusion 正向提示词时,主要包含画面内容(主体、动作、道具、环境等)、画面风格、画面构图、通用质量关键词这几部分。

在编写正向提示词时,需要注意基本问题:

  • 使用准确的词汇:尽量使用具体、精确的词汇来描述想要的图像,避免模糊和歧义。
  • 逐步优化:如果第一次生成的图像不符合预期,可以根据结果调整提示词,逐步优化,直到得到满意的图像。
  • 避免过于复杂:虽然使用提示词可以添加很多细节,但提示词过于冗长复杂可能会让模型难以理解,导致生成的图像效果不佳。
  • 符合模型能力:要了解所使用的模型的特点和能力范围,提示词要在模型能够处理的范围内。
  • 尽可能使用英文提示词:一般模型对于英文提示词能更精准地与模型预训练的知识匹配,从而可能生成更符合预期、细节更丰富、风格更纯正的图像。

画面主体

主体决定了图像的中心元素,比如人物、动物、建筑等,当我们只输入主体的提示词时,生成的结果会非常随机,不同风格的模型也会有不同的效果。

以生成一张动物图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8

  • 正向提示词(中文):猫

  • 正向提示词(英文):cat

  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)

  • 采样方法:Euler

  • 迭代步数:30

  • 提示词引导系数:3.5

  • 图片尺寸:1024x768

  • 图片数量:4

生成效果:

画面动作

动作可以为主体增加动态感,包括肢体动作、表情、人物状态或更加复杂细节的动态等,可以在主体提示词后加上动作详细描述主体的动作,比如跳跃、奔跑、坐着等。

以生成一张动物图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):猫,奔跑,跳跃
  • 正向提示词(英文):cat,running,jumping
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768
  • 图片数量:4

生成效果:

画面道具

道具是为主体配备的物品,包括人物的一些特征,可以在动作描述的提示词后面加入描述外观的提示词,如短发、带着耳机、白色衬衫等。

以生成一张动物图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):猫,奔跑,跳跃,胸前挂着铃铛,戴着耳机,戴着眼镜
  • 正向提示词(英文):Cat,running,jumping,wearing a bell on the chest,wearing headphones,wearing glasses
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768
  • 图片数量:4

生成效果:

画面环境

环境即主体所处的背景,可以在外观提示词后加入形容环境背景的提示词,如在森林中、城市街头、海边、大草原等。

以生成一张动物图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):猫,奔跑,跳跃,胸前挂着铃铛,戴着耳机,戴着眼镜,在大草原上,蓝天白云
  • 正向提示词(英文):Cat,running,jumping,with a bell hanging on the chest,wearing headphones,wearing glasses,on the grassland,blue sky with white clouds
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768
  • 图片数量:4

生成效果:

画面风格

画面风格提示词也是至关重要的,虽然通过更换不同的模型可以更改不同的风格,但很多时候一个模型也可以有多种风格,并可以通过提示词进行风格切换。

以生成一张动物图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):猫,奔跑,跳跃,卡通,动漫卡通,动画风格,平面动漫
  • 正向提示词(英文):
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768
  • 图片数量:4

生成效果:

画面构图

构图决定元素的排列方式,如对角线构图、中心构图、广角镜头、长焦镜头等。

以生成一张动物图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):猫,奔跑,跳跃,长焦镜头
  • 正向提示词(英文):Cat,running,jumping,telephoto lens
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768
  • 图片数量:4

生成效果:

通用质量提示词

为了提高生成图像的质量,可以加入一些描述画面性质的通用质量提示词。

常用的通用质量提示词:

  • 色彩形容:色彩鲜艳(vibrant colors)、层次丰富(rich layers)、高饱和(high saturation)。
  • 光影自然:完美的灯光(perfect lighting)、自然过渡(natural transitions)、真实感(realism)。
  • 镜头效果:景深(depth of field)、移轴镜头(off-axis lens)、镜头炫光(lens glare)、焦外成像(out of focus imaging)、微距镜头(macro lens)、鱼眼镜头(fisheye lens)、超广角(ultra wide angle)。
  • 质量形容:完美的摄影(perfect photography)、大师级摄影(master level photography)、超高清晰度(ultra-high definition)、超高细节(ultra-high detail)、超高分辨率(ultra-high resolution)、8K 分辨率(8K resolution)。
  • 艺术风格:大师杰作(masterpieces by masters)、具有鲜明个性的艺术作品(works of art with distinct personalities)。
  • CG 效果:高质量的 CG 作品(high-quality CG works)、逼真的三维渲染(realistic 3D rendering)。

以生成一张食品图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):一个汉堡,产品实拍,深色背景,色彩鲜艳,层次丰富,高饱和,完美的灯光,自然过渡,真实感,景深,完美的摄影,大师级摄影,超高清晰度,超高细节
  • 正向提示词(英文):a hamburger, product shot, dark background, vibrant colors, rich layers, high saturation, perfect lighting, natural transitions, realism, depth of field, perfect photography, master level photography, ultra-high definition, ultra-high details
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768
  • 图片数量:4

生成效果:

生成人物 + 场景

以生成一张国风古装女孩在樱花树下跳舞为主题的图像为例。

根据主题,提示词拆分为人物、动作、背景。

  • 人物:一个女孩,穿着古装,华丽的汉服,飘逸的裙摆。
  • 动作:跳舞,轻盈起舞,舞姿优雅。
  • 背景:盛开的樱花,飘落的花瓣。

在正向提示词中明确画面风格与构图。

  • 风格:插画风格,清新,唯美。
  • 构图:全身像,景深镜头。

在正向提示词中调整画面细节与质量。

  • 色彩:色彩鲜艳。
  • 灯光:完美的灯光,柔和,温暖。
  • 画面质量:高清画质,超高分辨率。

提示词组合完毕,调整其他生图参数。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):一个女孩,穿着古装,华丽的汉服,飘逸的裙摆,跳舞,轻盈起舞,舞姿优雅,盛开的樱花,飘落的花瓣,插画风格,清新,唯美,全身像,景深镜头,色彩鲜艳,完美的灯光,柔和,温暖,高清画质,超高分辨率
  • 正向提示词(英文):A girl,dressed in traditional costume,a magnificent Hanfu,flowing skirt,dancing,light and graceful dance,elegant movements,blooming cherry blossoms,falling petals,illustration style,fresh,beautiful,full shot,depth of field lens,vivid colors,perfect lighting,soft,warm,high definition quality,absurdres
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768
  • 图片数量:4

生成效果:

负向提示词技巧

去除画面中多余的杂物

在 Stable Diffusion 中,负向提示词可以帮助我们去除画面中不想要的元素或杂物,添加特定的负向提示词,可以指导模型在生成图像时避免这些不需要的元素。

改变画面质量

在 Stable Diffusion 中,负向提示词还可以用于改变画面的整体质量,添加与画面质量相关的负向提示词,可以调整画面的清晰度、色彩、光影等。

常用的画面质量类负向提示词:

  • 分辨率与清晰度:低分辨率(lowres)、模糊(blurry)、细节丢失(loss of details)、最差质量(worstquality)。

  • 色彩与对比度:无色(colorless)、色彩暗淡(dull colors)、对比度弱(weak contrast)、色彩平淡(flat colors)、色彩浑浊(muddy colors)

  • 图像瑕疵与伪影:图像嘈杂(noisy image)、伪影(artifacts)、色带(color banding)、锯齿状(jagged edges)、抖动(motion blur artifacts)

  • 渲染问题:渲染伪影(rendering artifacts)、渲染不完整(incomplete rendering)、不自然的光照(unnatural lighting)、阴影问题(shadow issues)、纹理问题(texture problems)

  • 风格与格式:过度风格化(over-stylized)、卡通化(cartoonized)、草图风格(sketch style)、抽象(abstract)、不自然的风格(unnatural style)

提示词优化进阶

提示词选择器

Stable Diffusion 社区开发者提供了提示词标签选择器插件 easy prompt selector(LiblibAI 已内置),可以根据需要快速选择提示词、调整提示词权重,提高提示词编写效率。

保存通用提示词

如果每一次生成图像都需要按照画面书写提示词,还是比较麻烦的,在 Stable Diffusion 中可以提前存储一些通用的提示词,在需要用时直接拿出来,可以减轻提示词编写工作的压力。

先在提示词输入框中,编写正向提示词和负向提示词。

  • 正向提示词:masterpiece, best quality, high resolution, original, ultra-high detail, extremely detailed, perfect lighting, extremely meticulous CG, master level work(杰作,最佳品质,高分辨率,原创,超高细节,极其细致的细节,完美的灯光,极其细致的 CG,大师级作品)
  • 负向提示词:ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2), worst quality, low quality, low resolution, monochrome, grayscale, skin blemishes, age spots, ugliness, repetition, pathology, incompleteness, blurriness, poor anatomical structure, poor proportion, disfigurement(Embedding 模型, 质量最差、质量低、分辨率低、单色、灰度、皮肤瑕疵、老年斑、丑陋、重复、病理、不完整、模糊、解剖结构差、比例差、毁容)

编写完成后,保存模板风格,后续只需要在提示词输入框中输入常规提示词,选择保存的模板风格进行生图即可。

提示词权重基础

在 Stable Diffusion 中,提示词权重决定了不同提示词在生成图像时的重要性或影响力,通过调整提示词权重,用户可以更精确地控制图像的生成结果,强调或弱化特定的画面元素、风格或主题。

常用的提示词权重的设置方式:

  • 默认权重与顺序:每个提示词默认权重为 1,提示词的顺序会影响权重,越靠前的提示词权重相对越高。比如"a beautiful landscape, a small house"中,"a beautiful landscape"的权重更高,对生成图像的整体风格和内容影响更大。
  • 小括号加权:使用小括号可提升权重,套一层小括号权重乘以 1.1 倍,比如"(red dress)",权重变为 1.1 倍。小括号加权最多可套三层,三层小括号权重可达 1.331 倍,即"(((red dress)))"。也可使用"(提示词:数值)"的形式精确控制权重,比如"(red dress:1.5)"将权重提高到 1.5 倍,建议权重值设置在 0.3-1.5 之间。
  • 中括号降权:中括号用于降低权重,套一层中括号权重乘以 0.9 倍,比如"[red dress]",权重变为 0.9 倍。中括号降权最多可套三层,三层中括号权重为 0.729 倍,即"[[[red dress]]]"。实践中较少使用这种方式降权,通常用小括号加数字的方式更方便,即"(red dress:0.8)"。
  • 大括号加权:大括号可用来增强提示词的权重,一个大括号相当于 1.05 倍权重,如"{red dress}"。大括号加权最多可使用三层,权重可达 1.15 倍,但实际运用中较少使用。
  • 尖括号调用 Lora:尖括号用于调用 Lora,,可以使用 Lora 模型生成更具风格化的图片。
  • 逻辑符号控制:"|"用于元素融合,会在两个元素之间循环往复绘制,如"red hair | blue hair"可实现红头发和蓝头发渐变效果,也支持加权"(red hair:1.2)|(blue hair:1.3)"。

调整画面物体比重

以生成一张物品图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边
  • 正向提示词(英文):A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768

生成效果:

调整生成参数如下。

  • 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边
  • 正向提示词(英文):(A red apple:0.7),(a bunch of pink flowers:1.5),the apple on the left,the flowers on the right
  • 随机数种子:1833578644

生成效果:

调整画面风格占比

以生成一张物品图为例,参考生成参数如下。

  • ckpt 检查点模型:F.1-dev-fp8
  • 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边,水彩风格
  • 正向提示词(英文):A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right
  • 负向提示词(英文):ng_deepnegative_v1_75t,(badhandv4:1.2),EasyNegative,(worst quality:2)
  • 采样方法:Euler
  • 迭代步数:30
  • 提示词引导系数:3.5
  • 图片尺寸:1024x768

生成效果:

调整生成参数如下。

  • 正向提示词(中文):一个红色的苹果,一束粉色的花,苹果在左边,花在右边
  • 正向提示词(英文):A red apple,a bunch of pink flowers,the apple on the left,the flowers on the right,(watercolor style.:1.7)
  • 随机数种子:1833578644

生成效果:

提示词反推

CLIP 反推

CLIP(Contrastive Language-Image Pretraining)即对比语言-图像预训练模型,是 OpenAI 公司于 2021 年推出的一种多模态模型,能够理解并匹配文本与图像之间的关联。

在 Stable Diffusion 中,CLIP 反推是指通过模型生成的图像来推测其可能的提示词,即可以将图像输入 CLIP 中,然后让 CLIP 直接提供与图像紧密相关的文本描述,帮助我们了解图像的主要特征和风格,但是 CLIP 反推的结果可能不够具体或精确。

使用 CLIP 反推需要在图生图模式下使用,需要先在 Stable Diffusion 中上传需要反推提示词的图像。图像上传完成后,点击 CLIP 反推按钮,等待模型运行后,会自动将反推的提示词输入到正向提示词输入框中。

DeepBooru 反推

DeepBooru 是一个基于深度学习的图像搜索引擎,它能够从大量图像数据集中识别并提取图像的特征,辅助用户生成提示词、进行图像分类检索以及加快数据集标注,但是存在标签准确性有限、粒度可能不符需求以及对图像上下文理解不足等局限。

DeepBooru 反推的使用方式和 CLIP 反推的使用方式大致相同,都需要在图生图模式下使用。

WD =1.4 标签器反推

WD 1.4 标签器是一个专门为 Stable Diffusion 设计的工具,能够帮助我们生成与图像高度相关的标签集合,这些标签可以作为提示词的参考,帮助我们更准确地描述图像的特征和风格。

WD 1.4 更加专注 Stable Diffusion 的上下文,其输出的标签通常与模型生成的图像更加吻合,但其反推结果仍然需要进一步调整和优化,以满足特定的创作需求。

在菜单栏中,可以选择 Tag 反推(Tagger)/ WD 1.4 标签器,上传图像后开始反推。

反推完成后,可以在页面底部卸载所有反推模型,释放显卡内存,提高之后生成图片的效率。

提示词网站分享

无界 AI 咒语生成器

无界 AI 咒语生成器是无界 AI 平台中为用户提供创作启发的特色功能,它设有多种描述维度如人物、色彩、五官等,每个维度下有丰富描述词,支持中文和英文,还提供随机咒语模式,能帮助用户尤其是新手更具体地描述创作需求,从而更轻松地进行 AI 绘画创作。

无界 AI 咒语生成器:https://www.wujieai.com/tag-generator

Promlib 提示词画廊

Promlib 提示词画廊是一个 AI 绘画提示词分享平台,提供用于 AI 绘画(Stable Diffusion 和 Midjourney)的提示词,并且提供该提示词在 AI 绘画中的呈现样式,做为给 AI 绘画爱好者的参考,目前该平台由个人开发者进行开发与维护,致力于把 Promlib 提示词画廊打造最大的 AI 绘画提示词分享平台。

Promlib 提示词画廊:https://promlib.com/

Civitai

Civitai 是一个专注于 AI 图像绘画和艺术作品创作、分享的在线平台和社区,用户可在此上传、分享自己用数据训练的自定义模型及生成的图像,也可浏览、下载模型和他人作品,每张图像会标注所用模型和参数设置,用户还能分享提示词、创作技巧和经验,通过评论、评分和收藏等与其他创作者互动。

Civitai:https://civitai.com/

LiblibAI

LiblibAI 是一个 AI 图像创作绘画平台和模型分享社区,基于 Stable Diffusion 模型提供在线版 WebUI,平台上有 10 万 + AI 模型和创作作品,涵盖多种风格和领域,用户可免费下载或在线使用,平台设有提示词窗口,能帮助用户优化提示词并翻译为英文,方便用户生成高质量图像。

LiblibAI:https://www.liblib.art/

相关推荐
智界前沿2 小时前
集之互动AIGC广告大片:以“高可控”技术重构品牌视觉想象
人工智能·重构·aigc
2501_930799243 小时前
数据安全新选择:访答本地知识库的隐私守护之道
人工智能·aigc·ocr
周末程序猿3 小时前
RAG实战|8种RAG架构浅析
langchain·aigc
后端小肥肠4 小时前
Coze编程首测:我用大白话搭了个“AI漫剧流水线”,太离谱了!
人工智能·aigc·coze
GISer_Jing7 小时前
AI赋能前端:从核心概念到工程实践的全景学习指南
前端·javascript·aigc
AAA_bo18 小时前
liunx安装canda、python、nodejs、git,随后部署私有网页内容提取工具--JinaReader全攻略
linux·python·ubuntu·typescript·aigc·python3.11·jina
百锦再8 小时前
Python实现开源AI模型引入及测试全过程
人工智能·python·ai·开源·aigc·模型·自然语言
文心智能体平台Agentbuilder10 小时前
行业智能体变现指南-信息技术专题
人工智能·aigc·智能体·行业智能体·自然语言开发·数字人智能体
墨风如雪18 小时前
OpenAI 甩出王炸:GPT-5.2-Codex 上线,这次它想做你的“赛博合伙人”
aigc