AIGC(Stable Diffusion 生态)常用知识与参数速查手册

本文针对游戏开发、日常出图、工业化生产场景,整理了SD生态最核心、最常用的知识与参数,覆盖基础概念、核心参数、模型体系、工作流与避坑指南,可直接作为日常工具书使用。


一、基础核心概念(必懂)

1. SD 核心组件

组件 作用 通俗理解
UNet 图像生成的核心,负责去噪生成画面 AI的"画笔",决定画什么、怎么画
VAE 负责图像的编码与解码,控制色彩和细节 AI的"调色板+放大镜"
CLIP 文本编码器,将提示词转换为AI能理解的向量 AI的"翻译官",把文字变成指令
Scheduler(调度器) 控制去噪的步骤和方式 AI的"绘画节奏"

2. 模型类型与区别

模型类型 大小 作用 存放路径
底模(Checkpoint) 2GB~14GB 基础大模型,决定整体画风和能力 models/Stable-diffusion
LoRA 50MB~300MB 微调特定风格、角色、道具 models/Lora
VAE 300MB~1GB 优化色彩、对比度和细节 models/VAE
ControlNet 1.5GB~4GB 精确控制画面构图、姿势、线条 models/ControlNet
Embedding 几MB~几十MB 优化提示词理解,过滤负面效果 models/embeddings

3. 主流架构对比

架构 代表版本 显存要求 适用场景
SD 1.5 v1.5 6GB+ 二次元、游戏素材、快速量产
SDXL 1.0 base+refiner 8GB+ 写实、高清、复杂场景
Flux schnell/dev 12GB+ 新一代画质天花板,文字生成

二、核心生成参数(直接抄)

1. 基础通用参数(所有场景通用)

参数 含义 推荐值 调整技巧
采样器(Sampler) 去噪算法 DPM++ 2M Karras 速度画质均衡首选;Euler a 适合创意发散
采样步数(Steps) 迭代绘制次数 20~25 低于15画质差,高于35提升不明显
CFG Scale 提示词遵循度 6~8 数值越高越贴合提示词,过高会画面僵硬
分辨率 输出图片尺寸 512×768(角色) 768×512(场景) SD1.5 不要超过1024,否则会出现多人物
种子(Seed) 随机数种子 -1(随机) 固定种子可复刻同款画面
批量数量(Batch size) 单次生成数量 1(6G显存) 显存越大可设越高,6G显存固定为1

2. 进阶参数(高清修复/图生图)

参数 含义 推荐值 调整技巧
高清修复(Hires.fix) 低分辨率生成后放大 开启 放大倍数1.5~2倍,过高会变形
重绘幅度(Denoising strength) 对原图的修改程度 0.250.4(高清修复)<br>0.50.7(风格迁移) 数值越低越接近原图,越高改动越大
CLIP Skip CLIP模型跳过层数 2(二次元) 1(写实) 二次元模型必设为2,提升画风还原度

3. ControlNet 核心参数

预处理器 对应模型 作用 权重推荐
openpose control_openpose 控制人物姿势、骨骼 0.7~0.9
canny control_canny 控制画面轮廓、边缘 0.6~0.8
lineart control_lineart 用线稿生成上色图 0.7~0.8
depth control_depth 控制画面景深、空间关系 0.5~0.7

4. 不同显存启动参数(必加)

显存 启动参数
6GB(RTX3060/2060) --xformers --medvram --no-half-vae
8GB(RTX3060Ti/4060) --xformers --no-half-vae
12GB+(RTX3080/4070Ti+) --xformers

三、提示词工程(核心技能)

1. 标准提示词结构

复制代码
[画质词] + [风格词] + [主体描述] + [动作/姿势] + [环境/背景] + [光影/色彩]

示例

复制代码
masterpiece, best quality, ultra detailed, genshin impact style, 1girl, klee, blonde hair, twin tails, holding bomb, standing, forest background, sunny day, soft lighting

2. 万能通用词库

  • 正向画质词masterpiece, best quality, ultra detailed, 8k, sharp focus, vibrant colors
  • 反向防崩词lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, blurry, watermark

3. 权重控制语法

  • (关键词:1.2):提升权重
  • (关键词:0.8):降低权重
  • [关键词1|关键词2]:随机选择一个关键词

四、常用模型推荐(游戏开发向)

1. 底模推荐

类型 模型名称 大小 特点
二次元通用 A333ANYTSimpler 2GB 线条干净,提示词兼容性好
碧蓝档案风格 bartstyledbBlueArchive 2GB 手游标杆画风,出图稳定
写实二次元 canistermix4 2GB 光影质感好,适合场景
国风仙侠 Chinese style illustration 2GB 水墨工笔质感,古风游戏首选

2. LoRA 推荐

类型 LoRA名称 大小 最佳权重
Q版角色 Blue Archive cute Chibi 144MB 0.6~0.8
线稿生成 novice-sketch-style 72MB 0.4~0.6
国风插画 Chinese style illustration v2 72MB 0.5~0.7

3. ControlNet 必装模型

  • control_openpose:姿势控制
  • control_canny:轮廓控制
  • control_lineart:线稿上色
  • control_depth:景深控制

五、常用工具与工作流

1. 主流客户端对比

客户端 特点 适用人群
Stable Diffusion WebUI 界面直观,插件丰富 新手入门、日常出图
ComfyUI 节点工作流,可自动化 进阶玩家、工业化生产
绘世启动器 一键部署,内置优化 国内用户首选

2. 必装插件

  • ADetailer:自动修复人脸和手部
  • ControlNet:精确控图
  • Ultimate SD Upscale:高清放大
  • WD1.4 Tagger:自动反推提示词

3. 标准游戏素材工作流

  1. 角色立绘:底模 + 角色LoRA + 正向/反向提示词 → 高清修复 → ADetailer 修脸
  2. 三视图:底模 + ControlNet OpenPose(三视图骨骼)→ 批量生成 → 统一风格
  3. 场景生成:写实底模 + 场景LoRA + ControlNet Canny(草图)→ 高清放大

六、常见问题与解决方案

问题 原因 解决方案
显存不足(Out of Memory) 分辨率过高、批量数量过大 降低分辨率,开启--medvram,关闭高清修复
画面发黑、色彩暗淡 VAE未加载或不兼容 手动选择对应VAE,添加--no-half-vae参数
人物畸形、多手多脚 提示词问题、分辨率过高 完善反向提示词,降低分辨率,使用ADetailer
模型不显示 路径错误、格式不支持 检查模型存放路径,确保是.safetensors格式
启动失败 中文路径、环境冲突 安装到纯英文路径,使用秋叶整合包

七、工业化生产进阶知识

  1. API调用:SD WebUI 和 ComfyUI 均提供 RESTful API,可通过 Python 代码批量生成素材
  2. 工作流导出:ComfyUI 工作流可导出为 JSON 文件,一键复用和分享
  3. 模型量化:将模型量化为 4bit/8bit,降低显存占用,几乎不损失画质
  4. 批量生成:通过脚本批量生成不同参数的图片,快速筛选优质结果
相关推荐
星秀日5 小时前
Spring Boot + Sa-Token 实时聊天系统:用户注册流程源码深度剖析
java·人工智能·spring·状态模式
Yingjun Mo5 小时前
3. Meta-Harness:模型基座外壳的端到端优化
人工智能·算法
Agent产品评测局6 小时前
标准化产品vs定制开发,制造业自动化方案选型横评:2026工业智能体落地深度指南
运维·人工智能·ai·chatgpt·自动化
放下华子我只抽RuiKe56 小时前
React 从入门到生产(一):JSX 与组件思维
前端·javascript·人工智能·pytorch·深度学习·react.js·前端框架
QYR_Jodie6 小时前
全电动注塑机械市场深度研判:36.13亿美元赛道,节能化转型如何驱动精密制造升级?
人工智能·市场报告
RSTJ_16256 小时前
PYTHON+AI LLM DAY FIFITY
人工智能·深度学习
逻辑君6 小时前
物理生物学研究报告【20260007】
人工智能·算法
weixin_446260856 小时前
终极工程指南:llama.cpp 本地AI部署手册 (2026)
人工智能·llama