前言

腾讯云最近推出了高性能应用服务 HAI，这个服务可以在几分钟之内就可以一键部署多种 AIGC 场景，比如AI作画、AI视频、AI写作等。本文就基于HAI部署一个AI 绘画环境，实现AI生成小说图片的功能。

HAI介绍

高性能应用服务（Hyper Application Inventor，HAI）是一款面向 AI 和科学计算的 GPU/NPU 应用服务产品，提供即插即用的强大算力和常见环境。它可以帮助中小企业和开发者快速部署语言模型（LLM）、AI 绘图、数据科学等高性能应用，原生集成配套的开发工具和组件，大大提升应用层的开发生产效率。

相比使用GPU 云服务器，HAI有以下几点优势：

不需要了解 GPU 型号，不用选择机型。基于 AI 应用，自动匹配合适套餐。
不需要自行部署驱动、CUDA、Python、Notebook 等环境依赖。分钟级快速启动，直接交付可用应用环境。
打包 GPU、云硬盘、带宽及网络，直接一键启动。
提供 WebUI 可视化连接方式，一键进入服务，不需要具备运维知识。
跨境线路自动择优，支持学术资源平台访问、下载加速。
支持关机不计费 、制作自定义应用等功能。用户可根据自身使用需求动态开关机，节省成本，长期使用。
分钟级自动构建LLM、AI作画等应用环境。提供多种预装模型环境，包含如StableDiffusion、ChatGLM等热门模型。

部署AI作画应用

开通HAI服务

购买成功后就可以移步HAI控制台进行授权开通。

一键部署应用（StableDiffusion WebUI）

HAI开通后，部署一个AI应用就非常简单了。这里创建一个AI作画应用 StableDiffusion WebUI，只需要两步：

在算力管理界面点击"新建"按钮。
选择 StableDiffusion WebUI 模型，并按照需求选择一个地域和算力方案。

"新建"按钮如下图。选择 StableDiffusion WebUI 进行购买。

购买成功后会看到创建中的应用，等待1分钟即可创建成功。

当状态为运行中时，即可通过点击下图红框进入 StableDiffusion WebUI 界面。

StableDiffusion WebUI 介绍

Stable Diffusion WebUI是一个基于Stable Diffusion模型的图形界面工具（如下图），通过这个WebUI，用户可以输入他们想要的文本描述，然后系统会根据这些描述自动生成相应的图像。

提示词

提示词对于生成图片至关重要，通过提示词可以描述希望生成的图像的内容、风格、画质、画风以及画面中不想出现的内容。

画质提示词一般为：

(masterpiece:1.2), best quality,masterpiece,extremely detailed wallpaper,highers,perfect lighting,8k wallpaper,

意思是生成高质量的、完美的、极其详细的画质。

其中()中的数字代表该提示词出现在画面中的权重。

如果想要生成二次元的风格，可以填写anime, comic ,gameCG,等提示词。

如果想要生成的画像更逼近人类，那么可以填写 photograph, photorealistic等提示词。

如果喜欢宫崎骏的画风，那么可以填写studio ghibli提示词。

总之，可以按照自己喜欢的风格、画风去填写相关提示词。

生成具体的内容同样需要提示词去描述，比如人物、年龄、发型、头发颜色、情绪表情、衣服装束、做什么事等等。

而画面中不想出现的内容也称之为负面提示词，比如：

NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality,((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, (((extra arms and legs))),

其中NSFW为不要出现不适宜工作场所的内容。

提示词插件

当然，如果对提示词的格式、语法不是很熟悉，可以在StableDiffusion WebUI安装一个插件提示词，这样在页面上就可以直接选择想要生成的提示词了。

安装提示词插件如下图，将 github.com/Physton/sd-... 复制到网址输入框直接安装即可。

在重启WebUI后就可以看到下图这样的中文提示词框，大家可以直接选择人物、服饰、表情动作等提示词。

采集器

在Stable Diffusion中，采样器是用于生成图像的一种技术或方法。它决定了模型如何从潜在空间中抽样并生成图像，因此，采样器在生成图像的过程中起着关键作用。

Stable Diffusion支持多种采样器，包括Euler、Euler a、LMS、Heum Euler、DPM和DDIM等。每种采样器都有其独特的特性和运算速度，可以根据应用场景进行选择。

AI 生成小说图片

接下来，基于高性能应用服务 HAI搭建的 StableDiffusion WebUI 生成小说图片。

小说场景描述

这里举例一个简单的小说场景：

程序员结束一天的工作后，在楼下随意吃了个便饭，巧遇同事，便友好地打了声招呼。饭后，他挤上了熙熙攘攘的地铁，踏上了回家的路。

场景分镜

按照场景描述，可以想象出几个镜头：

程序员穿着衬衫和裤子，背着背包走在人来人往的路上。
程序员穿着衬衫坐在小吃摊前，面前是一碗热腾腾的面条。
一位穿着制服的年轻女同事笑着和程序员打招呼。
许多人排队等公交的画面。
程序员回到家的画面。

根据提示词生成图片

根据第一个镜头，可以填写相关的提示词，比如画面中有高楼大厦、人来人往的人群、衬衫和裤子、程序员正在走路等。

这里选择生成宫崎骏的画风，加上画质、画风、画面描述等，完整的提示词如下：

(masterpiece:1.2), best quality,masterpiece,extremely detailed wallpaper,highers,perfect lighting,8k wallpaper,studio ghibli, 1boy, shirt, pants, backpack, sunny, office building, after work, walking, bustling with pedestrians,

将提示词和负面提示词分别填入，点击生成即可，如下图。

其余几个镜头的画面描述内容分别为：

1boy, shirt, pants, backpack, a bowl of noodles,food stand,
a bowl of noodles,(1girl),smile,waving,business_suit,upper_body,front view,looking_at_screen,
(bus),((crowd)),shirt,pants,backpack,arm_up,holding_bag,
backpack, cat, floor, window, living room

将这些提示词依次填入进行生成，就完成了通过AI生成小说图片的工作了。

最后，展示。

镜头1 镜头2 镜头3 镜头4 镜头5