stable diffusion文生图

本节内容，是stable diffusion的文生图详细讲解课程，我们将学习在stable diffusion中，如何书写优秀的提示语句以及提示词的设计有哪些可以借鉴的规范和技巧。

然后我们会详细讲解文生图中的一些常用参数，学习完本节课程，相信大家便能快速书写出合适的提示语句，并通过调整参数更好地使用stable diffusion webui绘制理想的图片。

stable diffusion和midjourney等AI绘图应用一样，需要提供提示词或提示语句，来引导AI生成图片。我们在之前的课程已经提到，stable diffusion webui，提供了正向提示词和反向提示词输入区域，用来分别书写希望出现在画面中的要素，和不希望出现的要素。提示词的编写是图片绘制的关键，图片生成质量很大程度上取决于提示词设计是否合理。

目前, stable diffusion对中文提示词支持还不是很好，在stable diffusion中最好使用英文来构建提示词，和midjourney一样，我们可以使用翻译软件将我们的中文提示词翻译成英文。

一：提示词书写参考框架

此外，早期的模型，stable diffusion对自然语言的处理能力有限，所以和midjourney类似，我们需要将图像构思尽量以逗号分隔的简短词或句来描述，这样stable diffusion能更好地理解我们的需求。

当然，stable diffsion近期推出的SDXL模型以及sd3模型已经有了很大的进步，这两个模型能更好地处理自然语言，所以在SDXL和sd 3模型下，可以使用更加自然的提示语句来生成图像。

但目前为止，仍然还有很多优秀的大模型是基于早期模型构建，所以我们还是应该掌握如何通过简短词句来构造提示语句。在stable diffusion中，通过简短词句构造提示语句可以遵循一定的方法和规范，为此，我们也总结了一个适应性较高的stable diffusion正向提示词编写框架用于协助大家快速编写提示语句。

我们的正向提示词框架主要分为4个部分

第一部分：画质、视角和风格

我们在提示语句的开头可以先描述图片的画质特征以及视角。

画质描述：如杰出作品，高分辨率，原始照片，逼真图片，这些提示词基本上是固定的，我们可以直接参考一些常用的写法

视角：如front view正面视角，side view侧面视角，from above俯视视角，from below仰视视角，close up特写镜头等等，有的时候我们也可以尝试增加一些艺术家名字、艺术风格的描述

第二部分：画面主体

这一部分，可以针对画面构思主体进行描述，比如人物以及人物特征

第三部分：环境和背景

在画面主体描述后，我们可以再增加对画面环境、背景、光线的详细描述

第四部分：特殊关键字

如果使用LoRA，LyCoris，embedding时，我们可以根据文档中的说明，添加与之相关的一些特殊关键字。我们会在后续LoRA，LyCoris，embedding课程中详细讲解这些知识

比如我们这里构思了一幅图像，图像的大致内容是一名在海边的女孩。

我们可以根据上述框架设计正向提示词

高品质，精细的细节，高分辨率，8K壁纸，中国女孩，黑色长发，白色裙子，正脸，高鼻梁，大眼睛，细长的眉毛，海边，海滩，蔚蓝的大海，明亮的光线，使用翻译软件翻译成英文

masterpiece,(best quality:1.3),ultra high res, raw photo, chilly nature documentary film photography, style: realistic pictures, 1girl, detailed skin, a clear face, snow mountain environment, natural light

这里的正向提示语句，开头对画质进行了描述，然后对画面主体元素进行了描述，再加上环境光线等描述词，便组成了完整的正向提示语句。

而对于反向提示词，在stable diffusion中我们通常可以使用固定的反向提示语句，比如

nsfw, mutated hands and fingers, deformed, bad anatomy, disfigured, poorly drawn face, mutated, extra , ugly, poorly drawn hands, missing , floating , disconnected limbs, malformed hands, out of focus, long neck, long body

我们分析一下这里的提示词，nsfw会经常使用到，具体含义是 not safe for work，工作中不适合的图像，通常是指颜色，暴力，血腥图像

然后是一些其他的描述，比如变异的手和手指，变形，不良解剖结构，毁容，画得不好的脸，变异，多余，丑陋，画得很差的手，缺失，漂浮，四肢断开，畸形的手，失去焦点，长脖子，长身体等等。

我们一般无需记忆反向提示词，网上可以搜索到很多反向提示词模版，这些提示词模版可以在一定程度上避免AI绘图过程中出现一些异常的元素。反向提示词模版有很多，但大部分是类似的。实际使用中，根据场景选择其中的一个即可。

另外，对于某些模型和插件，也会需要增加一些固定的反向提示词关键词，我们在后续的课程中，遇到该类型的反向提示词，会特别说明。

我们在这里使用SDXL版本的模型，输入上述正向和反向提示词，点击生成按钮，可以看到stable diffusion很快帮我们生成了相应的图片。

二：提示词权重

在midjourney的课程中，我们有学习到可以对提示词设置权重，来引导图像的生成。而在stable diffusion中，同样可以对提示词设置权重，从而在AI绘图过程增加或降低这些提示词元素对生成图像的影响程度。

stable diffusion中,默认权提示词重值为1.我们可以通过多种方式设置目标提示词的权重，

第一：小括号，将提示词放在小括号中代表权重为1.1 ，增加权重，如果两个小括号代表权重为1.1*1.1，三个则代表权重为1.1*1.1*1.1

第二：中括号，将提示词放在小括号中代表权重为0.9，减少权重

第三：大括号，将提示词放在小括号中代表权重为1.05，增加权重

大家在看到其他人写的提示词中含有小中大括号，需要理解其涵义

第四：小括号使用冒号+数值的方式则是赋值权重，权重由冒号后的数字来决定比如（tree:1.5）表示权重值为1.5（增加）,(tree:0.7)表示权重值为0.7

我们这里还要特别提醒，中括号和大括号除了权重还有更多高级用法，比如步数设置，元素混合设置等等，我们简单说明一下，

比如[flower:5] 中括号中的flower后跟一个冒号然后接整数数字，代表从第5步开始画花这一元素

而[flower:0.5]，冒号后跟的是小数，则代表从采样总步数的50%开始画花这一元素。