新手入门 ComfyUI:从零理解 AI 绘图工作流

前言

现在 AI 绘图工具很多,其中 ComfyUI 是比较适合深入学习的一种。

它不像普通生图工具那样只提供一个输入框,而是使用"节点工作流"的方式,把整个图片生成过程拆开。这样虽然刚开始看起来复杂,但理解之后会发现它非常灵活。

这篇文章主要记录我对 ComfyUI 基础知识的学习理解,适合刚接触 AI 绘图的新手阅读。


一、ComfyUI 是什么?

ComfyUI 是一个基于节点的 AI 图像生成工具。

简单来说,它通过一个个节点完成图片生成流程。

比如:

复制代码
加载模型 → 输入提示词 → 设置参数 → 采样生成 → 解码图片 → 保存图片

每一步都对应一个节点。

这种方式的好处是流程清楚,可控性强,适合做复杂的 AI 绘图任务。


二、为什么 ComfyUI 值得学习?

ComfyUI 的优点主要有几个:

1. 流程透明

你可以清楚看到图片是如何一步步生成的。

不像一些一键生图工具,只能输入提示词,然后等待结果。

2. 可控性强

ComfyUI 可以精细控制模型、提示词、采样器、尺寸、种子、LoRA、ControlNet 等参数。

3. 适合进阶

后期想做图生图、局部重绘、高清修复、风格控制、批量生成,ComfyUI 都比较方便。

4. 工作流可以复用

别人分享的工作流可以导入使用,自己做好的工作流也可以保存下来。


三、ComfyUI 常见节点介绍

1. Checkpoint Loader

这个节点用于加载模型。

模型决定了图片的大致风格和生成能力。

常见模型类型:

复制代码
SD 1.5
SDXL
真实风格模型
动漫风格模型
二次元模型

没有模型,就无法生成图片。


2. CLIP Text Encode

这个节点用于输入提示词。

一般分为两类:

复制代码
正向提示词:想要生成什么
负向提示词:不想出现什么

例如正向提示词:

复制代码
a beautiful girl, anime style, high detail, soft light

负向提示词:

复制代码
low quality, blurry, bad hands, watermark, text

提示词写得越清楚,生成结果通常越接近预期。


3. Empty Latent Image

这个节点用于设置图片尺寸。

常见尺寸:

复制代码
512x512
768x768
1024x1024

新手建议先从小尺寸开始,速度更快,也不容易占用太多资源。


4. KSampler

KSampler 是 ComfyUI 里非常重要的节点。

它负责真正的采样生成。

常见参数:

复制代码
steps:生成步数
cfg:提示词引导强度
seed:随机种子
sampler:采样器
scheduler:调度器

新手可以先使用默认参数,不要一次改太多。


5. VAE Decode

模型生成的内容一开始不是普通图片,而是 latent 数据。

VAE Decode 的作用就是把这些数据转换成我们能看到的图片。


6. Save Image

这个节点用于保存最终图片。

生成完成后,结果会通过这个节点输出并保存。


四、新手常用参数建议

Steps

生成步数。

建议范围:

复制代码
20 ~ 30

步数太低,图片可能细节不足。

步数太高,耗时会变长。


CFG

提示词控制强度。

建议范围:

复制代码
6 ~ 8

CFG 太低,模型可能不听提示词。

CFG 太高,画面可能变得僵硬、不自然。


Seed

随机种子。

同样的 seed、模型、提示词和参数,可以生成相近结果。

如果想随机生成,可以使用随机 seed。

如果想复现某张图,就要保存 seed。


图片尺寸

新手建议:

复制代码
512x512
768x768

不要一开始就设置很大,否则容易变慢或报错。


五、提示词怎么写?

提示词可以从几个方面写:

复制代码
主体 + 风格 + 场景 + 光影 + 细节 + 质量词

例如:

复制代码
a beautiful cyberpunk city, rainy night, neon lights, cinematic lighting, high detail

可以拆开理解:

复制代码
主体:cyberpunk city
场景:rainy night
光影:neon lights, cinematic lighting
质量:high detail

负向提示词可以写:

复制代码
low quality, blurry, bad anatomy, watermark, text, distorted

新手不要一开始堆太多词,先用简单提示词测试效果。


六、学习 ComfyUI 的正确顺序

建议按这个路线学习:

复制代码
1. 跑通默认工作流
2. 学会改提示词
3. 学会调 steps、cfg、seed
4. 学会换模型
5. 学习 LoRA
6. 学习 ControlNet
7. 学习图生图
8. 学习高清修复
9. 学习导入复杂工作流

不要一开始就追求复杂节点。

先把基础流程理解清楚,后面学高级功能会轻松很多。


七、常见问题

1. 为什么生成很慢?

可能原因:

复制代码
图片尺寸太大
steps 设置太高
模型太大
显存或算力不足

可以先降低尺寸和 steps。


2. 为什么生成结果很奇怪?

可能原因:

复制代码
提示词不清楚
负向提示词太少
模型不适合当前风格
CFG 设置不合适

建议一次只调整一个参数。


3. 为什么别人工作流导入后不能用?

可能原因:

复制代码
缺少模型
缺少插件
节点版本不一致
模型路径不正确

导入别人的工作流时,要注意依赖是否完整。


八、总结

ComfyUI 看起来复杂,但本质逻辑并不难。

只要理解下面这条流程:

复制代码
模型 + 提示词 + 参数 + 采样器 = 生成图片

就已经掌握了入门核心。

对于新手来说,最重要的是先跑通基础工作流,再一步步学习 LoRA、ControlNet、图生图和高清修复。

ComfyUI 的优势在于可控性强、扩展性好,适合想深入学习 AI 绘图的人长期使用。

推荐标签

复制代码
ComfyUI, AI绘画, AIGC, Stable Diffusion, 文生图, 图生图, CSDN教程, CloudStudio
相关推荐
大模型真好玩1 小时前
别拿Claude Code当对话框:这6个GitHub项目让你吃透代码智能体
人工智能·agent·deepseek
Ajie'Blog1 小时前
AI 周报 | Claude Opus 4.8、Copilot Agent 和 Codex 工作流加速
前端·人工智能·gpt·ai·copilot·ai编程
网安蟹佬霸1 小时前
国产4B认知模型新程Alpha落地:李笛带队复刻卡帕西预言,4B参数等效GPT-5.4
人工智能
虾壳云智能1 小时前
详解 OpenClaw 部署难点 绕过安全拦截与路径报错解决方案
人工智能·github·open claw教程·open claw一键部署
FPGA小徐1 小时前
AI 浪潮下,FPGA 如何实现自我重塑与行业变革
人工智能·fpga开发
哦哦~9211 小时前
AI 赋能 CFD :从 Fluent 仿真到物理信息机器学习的智能流体工程实战
人工智能·机器学习·cfd·fluent
EQUINOX11 小时前
【ch03】Coding-attention-mechanisms
人工智能·深度学习·机器学习
俊哥V1 小时前
每日 AI 研究简报 · 2026-06-10
人工智能·ai
美狐美颜sdk1 小时前
从0到1解析直播APP开发中的第三方美颜SDK集成方案
人工智能·直播美颜sdk·视频美颜sdk·美颜api·美狐美颜sdk