新手入门 ComfyUI:从零理解 AI 绘图工作流

前言

现在 AI 绘图工具很多,其中 ComfyUI 是比较适合深入学习的一种。

它不像普通生图工具那样只提供一个输入框,而是使用"节点工作流"的方式,把整个图片生成过程拆开。这样虽然刚开始看起来复杂,但理解之后会发现它非常灵活。

这篇文章主要记录我对 ComfyUI 基础知识的学习理解,适合刚接触 AI 绘图的新手阅读。


一、ComfyUI 是什么?

ComfyUI 是一个基于节点的 AI 图像生成工具。

简单来说,它通过一个个节点完成图片生成流程。

比如:

复制代码
加载模型 → 输入提示词 → 设置参数 → 采样生成 → 解码图片 → 保存图片

每一步都对应一个节点。

这种方式的好处是流程清楚,可控性强,适合做复杂的 AI 绘图任务。


二、为什么 ComfyUI 值得学习?

ComfyUI 的优点主要有几个:

1. 流程透明

你可以清楚看到图片是如何一步步生成的。

不像一些一键生图工具,只能输入提示词,然后等待结果。

2. 可控性强

ComfyUI 可以精细控制模型、提示词、采样器、尺寸、种子、LoRA、ControlNet 等参数。

3. 适合进阶

后期想做图生图、局部重绘、高清修复、风格控制、批量生成,ComfyUI 都比较方便。

4. 工作流可以复用

别人分享的工作流可以导入使用,自己做好的工作流也可以保存下来。


三、ComfyUI 常见节点介绍

1. Checkpoint Loader

这个节点用于加载模型。

模型决定了图片的大致风格和生成能力。

常见模型类型:

复制代码
SD 1.5
SDXL
真实风格模型
动漫风格模型
二次元模型

没有模型,就无法生成图片。


2. CLIP Text Encode

这个节点用于输入提示词。

一般分为两类:

复制代码
正向提示词:想要生成什么
负向提示词:不想出现什么

例如正向提示词:

复制代码
a beautiful girl, anime style, high detail, soft light

负向提示词:

复制代码
low quality, blurry, bad hands, watermark, text

提示词写得越清楚,生成结果通常越接近预期。


3. Empty Latent Image

这个节点用于设置图片尺寸。

常见尺寸:

复制代码
512x512
768x768
1024x1024

新手建议先从小尺寸开始,速度更快,也不容易占用太多资源。


4. KSampler

KSampler 是 ComfyUI 里非常重要的节点。

它负责真正的采样生成。

常见参数:

复制代码
steps:生成步数
cfg:提示词引导强度
seed:随机种子
sampler:采样器
scheduler:调度器

新手可以先使用默认参数,不要一次改太多。


5. VAE Decode

模型生成的内容一开始不是普通图片,而是 latent 数据。

VAE Decode 的作用就是把这些数据转换成我们能看到的图片。


6. Save Image

这个节点用于保存最终图片。

生成完成后,结果会通过这个节点输出并保存。


四、新手常用参数建议

Steps

生成步数。

建议范围:

复制代码
20 ~ 30

步数太低,图片可能细节不足。

步数太高,耗时会变长。


CFG

提示词控制强度。

建议范围:

复制代码
6 ~ 8

CFG 太低,模型可能不听提示词。

CFG 太高,画面可能变得僵硬、不自然。


Seed

随机种子。

同样的 seed、模型、提示词和参数,可以生成相近结果。

如果想随机生成,可以使用随机 seed。

如果想复现某张图,就要保存 seed。


图片尺寸

新手建议:

复制代码
512x512
768x768

不要一开始就设置很大,否则容易变慢或报错。


五、提示词怎么写?

提示词可以从几个方面写:

复制代码
主体 + 风格 + 场景 + 光影 + 细节 + 质量词

例如:

复制代码
a beautiful cyberpunk city, rainy night, neon lights, cinematic lighting, high detail

可以拆开理解:

复制代码
主体:cyberpunk city
场景:rainy night
光影:neon lights, cinematic lighting
质量:high detail

负向提示词可以写:

复制代码
low quality, blurry, bad anatomy, watermark, text, distorted

新手不要一开始堆太多词,先用简单提示词测试效果。


六、学习 ComfyUI 的正确顺序

建议按这个路线学习:

复制代码
1. 跑通默认工作流
2. 学会改提示词
3. 学会调 steps、cfg、seed
4. 学会换模型
5. 学习 LoRA
6. 学习 ControlNet
7. 学习图生图
8. 学习高清修复
9. 学习导入复杂工作流

不要一开始就追求复杂节点。

先把基础流程理解清楚,后面学高级功能会轻松很多。


七、常见问题

1. 为什么生成很慢?

可能原因:

复制代码
图片尺寸太大
steps 设置太高
模型太大
显存或算力不足

可以先降低尺寸和 steps。


2. 为什么生成结果很奇怪?

可能原因:

复制代码
提示词不清楚
负向提示词太少
模型不适合当前风格
CFG 设置不合适

建议一次只调整一个参数。


3. 为什么别人工作流导入后不能用?

可能原因:

复制代码
缺少模型
缺少插件
节点版本不一致
模型路径不正确

导入别人的工作流时,要注意依赖是否完整。


八、总结

ComfyUI 看起来复杂,但本质逻辑并不难。

只要理解下面这条流程:

复制代码
模型 + 提示词 + 参数 + 采样器 = 生成图片

就已经掌握了入门核心。

对于新手来说,最重要的是先跑通基础工作流,再一步步学习 LoRA、ControlNet、图生图和高清修复。

ComfyUI 的优势在于可控性强、扩展性好,适合想深入学习 AI 绘图的人长期使用。

推荐标签

复制代码
ComfyUI, AI绘画, AIGC, Stable Diffusion, 文生图, 图生图, CSDN教程, CloudStudio
相关推荐
Bigfish_coding9 小时前
前端转agent-【python】-15 AI Agent 可观测性入门:LangFuse 链路追踪、Token 监控与 LLM 质量评估
人工智能
我唔知啊9 小时前
我把 Claude Code 拆成了一间餐厅:从一句话到一次回复,中间到底发生了什么
人工智能
Harry技术9 小时前
02 · Codex 核心概念:代理、沙箱、审批和项目说明书
人工智能
阿里云大数据AI技术9 小时前
Agentic Memory Extension 支持对接主流Agent - 适用于 Claude Code、CodeX等
人工智能·agent
我唔知啊10 小时前
不是让 AI 写代码,我是在指挥 AI 干活:一套打磨出来的 AI 编程工作流
人工智能
ZzT10 小时前
在 GitHub 上 @一下 claude,它自己把 issue 改成 PR
人工智能·开源
不加辣椒10 小时前
第15章 上下文窗口管理与长文本策略
人工智能
牛奶11 小时前
AI 能赚钱了——但赚的不是你
人工智能·ai编程·nvidia
凌杰11 小时前
AI 学习笔记:研究方法的演变
人工智能
半盏药香11 小时前
由于jinja2的starlette版本过高引发的问题:500 Server Error TypeError: unhashable type: 'dict'
人工智能