本文针对游戏开发、日常出图、工业化生产场景,整理了SD生态最核心、最常用的知识与参数,覆盖基础概念、核心参数、模型体系、工作流与避坑指南,可直接作为日常工具书使用。
一、基础核心概念(必懂)
1. SD 核心组件
| 组件 | 作用 | 通俗理解 |
|---|---|---|
| UNet | 图像生成的核心,负责去噪生成画面 | AI的"画笔",决定画什么、怎么画 |
| VAE | 负责图像的编码与解码,控制色彩和细节 | AI的"调色板+放大镜" |
| CLIP | 文本编码器,将提示词转换为AI能理解的向量 | AI的"翻译官",把文字变成指令 |
| Scheduler(调度器) | 控制去噪的步骤和方式 | AI的"绘画节奏" |
2. 模型类型与区别
| 模型类型 | 大小 | 作用 | 存放路径 |
|---|---|---|---|
| 底模(Checkpoint) | 2GB~14GB | 基础大模型,决定整体画风和能力 | models/Stable-diffusion |
| LoRA | 50MB~300MB | 微调特定风格、角色、道具 | models/Lora |
| VAE | 300MB~1GB | 优化色彩、对比度和细节 | models/VAE |
| ControlNet | 1.5GB~4GB | 精确控制画面构图、姿势、线条 | models/ControlNet |
| Embedding | 几MB~几十MB | 优化提示词理解,过滤负面效果 | models/embeddings |
3. 主流架构对比
| 架构 | 代表版本 | 显存要求 | 适用场景 |
|---|---|---|---|
| SD 1.5 | v1.5 | 6GB+ | 二次元、游戏素材、快速量产 |
| SDXL 1.0 | base+refiner | 8GB+ | 写实、高清、复杂场景 |
| Flux | schnell/dev | 12GB+ | 新一代画质天花板,文字生成 |
二、核心生成参数(直接抄)
1. 基础通用参数(所有场景通用)
| 参数 | 含义 | 推荐值 | 调整技巧 |
|---|---|---|---|
| 采样器(Sampler) | 去噪算法 | DPM++ 2M Karras | 速度画质均衡首选;Euler a 适合创意发散 |
| 采样步数(Steps) | 迭代绘制次数 | 20~25 | 低于15画质差,高于35提升不明显 |
| CFG Scale | 提示词遵循度 | 6~8 | 数值越高越贴合提示词,过高会画面僵硬 |
| 分辨率 | 输出图片尺寸 | 512×768(角色) 768×512(场景) | SD1.5 不要超过1024,否则会出现多人物 |
| 种子(Seed) | 随机数种子 | -1(随机) | 固定种子可复刻同款画面 |
| 批量数量(Batch size) | 单次生成数量 | 1(6G显存) | 显存越大可设越高,6G显存固定为1 |
2. 进阶参数(高清修复/图生图)
| 参数 | 含义 | 推荐值 | 调整技巧 |
|---|---|---|---|
| 高清修复(Hires.fix) | 低分辨率生成后放大 | 开启 | 放大倍数1.5~2倍,过高会变形 |
| 重绘幅度(Denoising strength) | 对原图的修改程度 | 0.250.4(高清修复)<br>0.50.7(风格迁移) | 数值越低越接近原图,越高改动越大 |
| CLIP Skip | CLIP模型跳过层数 | 2(二次元) 1(写实) | 二次元模型必设为2,提升画风还原度 |
3. ControlNet 核心参数
| 预处理器 | 对应模型 | 作用 | 权重推荐 |
|---|---|---|---|
| openpose | control_openpose | 控制人物姿势、骨骼 | 0.7~0.9 |
| canny | control_canny | 控制画面轮廓、边缘 | 0.6~0.8 |
| lineart | control_lineart | 用线稿生成上色图 | 0.7~0.8 |
| depth | control_depth | 控制画面景深、空间关系 | 0.5~0.7 |
4. 不同显存启动参数(必加)
| 显存 | 启动参数 |
|---|---|
| 6GB(RTX3060/2060) | --xformers --medvram --no-half-vae |
| 8GB(RTX3060Ti/4060) | --xformers --no-half-vae |
| 12GB+(RTX3080/4070Ti+) | --xformers |
三、提示词工程(核心技能)
1. 标准提示词结构
[画质词] + [风格词] + [主体描述] + [动作/姿势] + [环境/背景] + [光影/色彩]
示例:
masterpiece, best quality, ultra detailed, genshin impact style, 1girl, klee, blonde hair, twin tails, holding bomb, standing, forest background, sunny day, soft lighting
2. 万能通用词库
- 正向画质词 :
masterpiece, best quality, ultra detailed, 8k, sharp focus, vibrant colors - 反向防崩词 :
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, blurry, watermark
3. 权重控制语法
(关键词:1.2):提升权重(关键词:0.8):降低权重[关键词1|关键词2]:随机选择一个关键词
四、常用模型推荐(游戏开发向)
1. 底模推荐
| 类型 | 模型名称 | 大小 | 特点 |
|---|---|---|---|
| 二次元通用 | A333ANYTSimpler | 2GB | 线条干净,提示词兼容性好 |
| 碧蓝档案风格 | bartstyledbBlueArchive | 2GB | 手游标杆画风,出图稳定 |
| 写实二次元 | canistermix4 | 2GB | 光影质感好,适合场景 |
| 国风仙侠 | Chinese style illustration | 2GB | 水墨工笔质感,古风游戏首选 |
2. LoRA 推荐
| 类型 | LoRA名称 | 大小 | 最佳权重 |
|---|---|---|---|
| Q版角色 | Blue Archive cute Chibi | 144MB | 0.6~0.8 |
| 线稿生成 | novice-sketch-style | 72MB | 0.4~0.6 |
| 国风插画 | Chinese style illustration v2 | 72MB | 0.5~0.7 |
3. ControlNet 必装模型
control_openpose:姿势控制control_canny:轮廓控制control_lineart:线稿上色control_depth:景深控制
五、常用工具与工作流
1. 主流客户端对比
| 客户端 | 特点 | 适用人群 |
|---|---|---|
| Stable Diffusion WebUI | 界面直观,插件丰富 | 新手入门、日常出图 |
| ComfyUI | 节点工作流,可自动化 | 进阶玩家、工业化生产 |
| 绘世启动器 | 一键部署,内置优化 | 国内用户首选 |
2. 必装插件
- ADetailer:自动修复人脸和手部
- ControlNet:精确控图
- Ultimate SD Upscale:高清放大
- WD1.4 Tagger:自动反推提示词
3. 标准游戏素材工作流
- 角色立绘:底模 + 角色LoRA + 正向/反向提示词 → 高清修复 → ADetailer 修脸
- 三视图:底模 + ControlNet OpenPose(三视图骨骼)→ 批量生成 → 统一风格
- 场景生成:写实底模 + 场景LoRA + ControlNet Canny(草图)→ 高清放大
六、常见问题与解决方案
| 问题 | 原因 | 解决方案 |
|---|---|---|
| 显存不足(Out of Memory) | 分辨率过高、批量数量过大 | 降低分辨率,开启--medvram,关闭高清修复 |
| 画面发黑、色彩暗淡 | VAE未加载或不兼容 | 手动选择对应VAE,添加--no-half-vae参数 |
| 人物畸形、多手多脚 | 提示词问题、分辨率过高 | 完善反向提示词,降低分辨率,使用ADetailer |
| 模型不显示 | 路径错误、格式不支持 | 检查模型存放路径,确保是.safetensors格式 |
| 启动失败 | 中文路径、环境冲突 | 安装到纯英文路径,使用秋叶整合包 |
七、工业化生产进阶知识
- API调用:SD WebUI 和 ComfyUI 均提供 RESTful API,可通过 Python 代码批量生成素材
- 工作流导出:ComfyUI 工作流可导出为 JSON 文件,一键复用和分享
- 模型量化:将模型量化为 4bit/8bit,降低显存占用,几乎不损失画质
- 批量生成:通过脚本批量生成不同参数的图片,快速筛选优质结果