写在前面:为什么要做这样一份规划
如果你和我一样,第一次打开ComfyUI的时候对着满屏的节点和密密麻麻的连线一脸茫然------恭喜你,你不是一个人。
坦白说,在接触ComfyUI之前,我用了相当长一段时间的Stable Diffusion WebUI。那个界面友好、操作直观,填填表单、点点按钮就能出图,确实很香。但慢慢地,我发现自己的需求越来越复杂:想同时控制多个ControlNet、想在生成流程中间插入自定义处理、想批量跑不同参数的对比实验......WebUI那种"填表式"的交互开始变得力不从心。
后来有人跟我推荐ComfyUI,说这东西"自由度极高、什么都能干"。我兴冲冲地去下了整合包,打开界面,沉默了十分钟。满屏的节点像电路图一样铺在眼前,我甚至不知道该从哪个节点开始拖。
但我很清楚一件事:ComfyUI代表的是AI创作工具的未来方向。 它彻底颠覆了传统WebUI的表单式交互逻辑,转而采用高度模块化、可视化、可复用的节点图谱架构。这种设计给了用户前所未有的工作流可控性和调试透明性。说白了,WebUI是"给你一个黑箱让你填参数",ComfyUI是"把黑箱拆开让你自己搭流水线"。
所以,我决定认真学。但问题来了:怎么学?网上教程虽多,但大多是零散的------今天看到一个讲ControlNet的,明天看到一个讲LoRA的,东一榔头西一棒槌,学完就忘,形不成体系。
于是我开始系统性地梳理ComfyUI的知识体系,并结合自己的学习经验,整理出了这份100天的课程学习规划。它不是一份"每天必须完成"的硬性任务清单,而是一张地图------告诉你这条路大致怎么走、每个阶段该关注什么、会遇到哪些坑。
如果你也正打算系统学习ComfyUI,希望这份规划能帮你少走一些弯路。
规划总览:四个阶段,100天
整个学习路径按照"认知→实操→进阶→精通"的逻辑递进。我把它分成了四个阶段:
- 第一阶段(第1-20天):入门启蒙------从零到一,能跑起来
- 第二阶段(第21-50天):基础夯实与实操------能看懂、能调优、能实战
- 第三阶段(第51-80天):进阶控制与优化------能精细控制、能解决复杂问题
- 第四阶段(第81-100天):精通与自主探索------能独立开发、能持续成长
每个阶段内部又细分为若干模块,每个模块对应3-7天的学习内容。你可以根据自己的时间灵活调整------每天花1-2小时,坚持100天,足以从完全零基础到独立搭建复杂的商业级工作流。
开始之前,先确认一下你的硬件条件: 建议NVIDIA显卡,显存8GB以上。如果显存不足,也不是不能学,但很多高阶操作(比如SDXL、视频生成)会非常吃力。
第一阶段:入门启蒙(第1-20天)------从零到一,能跑起来
这一阶段的目标只有一个:让你的ComfyUI跑起来,并且生成第一张图。
不要一上来就想搞懂所有节点的原理,那会把你吓跑。先"能用",再"懂为什么"。
模块一:环境搭建与初次运行(第1-5天)
第1天:认识ComfyUI
花点时间搞清楚ComfyUI到底是什么。它的核心设计理念是"节点式工作流"------每个节点代表一个特定的操作或功能,节点通过连线连接,共同协同完成一项AI绘画任务。与WebUI相比,ComfyUI的优势在于:工作流可视化、可复用、对显存占用更小、支持更灵活的插件扩展。
同时了解一下ComfyUI的界面布局:左侧是节点工具箱(所有"积木"都在这里),中间是巨大的画布(搭建工作流的地方),右侧通常是快捷操作和模型管理面板。
第2-3天:安装部署
根据你的操作系统(Windows/macOS/Linux)完成ComfyUI的本地安装。推荐使用整合包(比如秋葉的整合包),对新手最友好。如果想自己动手,可以创建conda虚拟环境:
conda create -n comfyui python=3.10
conda activate comfyui
pip install torch torchvision torchaudio
然后从官方GitHub仓库克隆ComfyUI并安装依赖。
第4天:下载第一个模型
去Civitai或HuggingFace下载一个Stable Diffusion 1.5或SDXL的基础模型(.ckpt或.safetensors格式),放到models/checkpoints/目录下。建议先从SD 1.5开始,因为它对硬件要求更低、生态最成熟。
第5天:跑通默认工作流,生成第一张图
打开ComfyUI,你会看到一个默认的文生图工作流。它的基本逻辑是:条件输入 → 潜空间生成 → 像素空间输出。具体来说:
- Checkpoint加载器选择你下载的模型
- CLIP文本编码器输入正向提示词和负向提示词
- 空Latent设定图片尺寸和批次数量
- K采样器在潜空间完成去噪生成
- VAE解码将潜空间图像转换为可视的像素图
输入一句简单的提示词(比如"a cat"),点击"Queue Prompt",等待几十秒。当第一张图出现在你面前的时候------恭喜你,入坑了。
模块二:理解核心概念(第6-12天)
第6-7天:搞懂节点、连线与数据类型
节点是ComfyUI的基本单元,每个节点代表一个特定功能。节点可以分成三大类:输入节点(加载图像/文本)、处理节点(CLIP编码、UNet去噪等)、输出节点(保存/预览结果)。
连线决定了数据流向。注意接口颜色------不同颜色的接口不能相互连接。这是ComfyUI的强类型约束,极大降低了因模型错配导致的静默失败。
第8-9天:理解Checkpoint、CLIP、VAE三大核心
一个Checkpoint加载器节点会同时输出三样东西:MODEL(UNet权重)、CLIP(文本编码器)、VAE(变分自编码器)。这三者缺一不可------MODEL负责去噪生成,CLIP负责理解文字提示,VAE负责在潜空间和像素空间之间转换。
第10-12天:熟悉界面操作与快捷键
掌握节点的添加(双击空白处搜索或右键菜单)、连接(拖拽接口)、禁用(右键Disable)、删除等基本操作。学会保存工作流(.json格式)和加载别人的工作流。这些看似基础的操作,会在后续的学习中大幅提升你的效率。
模块三:第一个完整工作流(第13-20天)
第13-15天:文生图工作流深度拆解
把默认的文生图工作流每一个节点、每一个参数都搞清楚。Steps (采样步数)控制生成质量,一般20-50步;CFG Scale (分类器自由引导尺度)控制提示词遵从度,一般7-9;Sampler(采样器)推荐DPM++ 2M Karras。尝试修改这些参数,观察输出图像的变化------这是建立直觉最快的方式。
第16-18天:图生图工作流
从文生图切换到图生图。核心工作流是:Load Image → VAE Encode → KSampler → VAE Decode。关键参数是denoise(降噪强度),它控制结果与原图的偏离程度------值越高变化越大。反复调整denoise值,观察图像在"忠实原图"和"自由创造"之间的连续变化。
第19-20天:保存与分享你的工作流
把你的工作流保存为.json文件。ComfyUI的工作流文件是纯文本格式,内含完整节点拓扑、参数快照和模型路径映射。这意味着你可以用Git做版本管理,也可以分享给其他人一键复现。整理一下你这20天的学习笔记和收藏的工作流,第一阶段收官。
第二阶段:基础夯实与实操(第21-50天)------能看懂、能调优、能实战
这一阶段的目标是:掌握主流的工作流类型,能够独立搭建常见场景的解决方案。
模块四:模型管理与微调(第21-30天)
第21-23天:LoRA的加载与使用
LoRA是目前最主流的模型微调方式------通过注入少量额外训练权重来修改模型,擅长学习特定人物、风格或物品。在ComfyUI中使用LoRA需要添加Lora Loader节点,将其连接到Checkpoint Loader和CLIP Text Encode之间。通过调节模型强度 和CLIP强度控制影响程度。
尝试加载一个风格LoRA(比如水墨风、赛博朋克),对比加与不加的效果差异。
第24-26天:Embeddings(文本嵌入)
Embeddings本质上是几个特殊的提示词向量,用于固定某些特征或作为负面约束。把下载的.pt文件放到models/embeddings/文件夹,在提示词中输入embedding:文件名即可调用。安装ComfyUI-Custom-Scripts插件可以实现自动补全。
第27-30天:ComfyUI Manager与自定义节点管理
ComfyUI Manager是管理自定义节点的神器。在界面右侧面板点击Manager,进入Custom Nodes Manager,搜索并安装你需要的插件。自定义节点是ComfyUI的扩展插件,能增加新功能------高级图像处理、微调、颜色调整等等,都由社区开发。
这一周的重点是学会"找插件"和"装插件" ,这将贯穿你后续所有的学习。
模块五:核心实战工作流(第31-45天)
第31-35天:ControlNet------让AI听你的话
ControlNet可能是ComfyUI最强大的功能之一。它通过提取输入图像的边缘、深度、姿态等特征图,在生成过程中严格约束输出图像的构图。
从最常用的Canny(线稿) 和OpenPose(姿态) 开始。工作流的核心是ControlNet Apply节点,strength参数控制约束强度。
- Canny:上传一张线稿,让AI严格按照线稿生成
- OpenPose:上传一张人物照片,让AI保持同样的姿态生成新人物
- Depth(深度图):控制图像的空间结构
尝试多重ControlNet叠加------比如同时用Canny控制构图、用OpenPose控制姿态,这会让你的工作流瞬间"专业"起来。
第36-40天:局部重绘(Inpainting)
Inpainting是对图像的指定区域(遮罩)进行重绘,保持其他部分不变。ComfyUI提供了三种核心方法:
- VAE内补编码器(VAEEncodeForInpaint):完全重写遮罩区域,适合替换为完全不同的内容
- 潜空间噪波遮罩(Set Latent Noise Mask):在潜空间添加噪声时保留遮罩区域原信息,适合微调
- ControlNet Inpaint:用专用Inpaint模型严格约束遮罩区域构图,适合保持姿态的大修改
常见坑:边缘生硬的话用Mask Feather节点做24px以上的羽化;内容不符就提高CFG值或增加提示词权重;面部畸形记得加负面词或使用ADetailer修复。
第41-45天:超分辨率与图像放大
ESRGAN、Real-ESRGAN等模型用于提升图像分辨率和细节。在生成流程末端,使用UltimateSDUpscale等节点加载.pth格式的超分模型进行放大。学会这个技能,你就能把1024×1024的图放大到4K甚至8K,同时保持细节不糊。
模块六:效率提升与工作流优化(第46-50天)
第46-48天:工作流设计原则
好的工作流应该是模块化的------把常用操作封装为子工作流,用Group节点进行逻辑分组。避免长距离连线(用PassThrough节点),关键参数用Slider节点可视化调节。
第49-50天:性能优化与批处理
节点复用策略:对重复操作使用Clone节点,避免不必要的图像格式转换。内存管理:及时断开不再使用的连接,对大分辨率图像优先处理。
学习批处理的实现逻辑------用一个循环遍历多张输入图片,自动完成整个处理流程。这是从"手工操作"走向"自动化生产"的关键一步。
第二阶段结束,你应该已经能够独立搭建至少10种不同的工作流了。
第三阶段:进阶控制与优化(第51-80天)------能精细控制、能解决复杂问题
这一阶段的目标是:掌握SDXL/Flux等新架构,能够处理视频生成等复杂任务。
模块七:新架构模型(第51-60天)
第51-55天:SDXL工作流
SDXL采用两阶段(Base+Refiner)流程,对提示词理解更好。学习搭建SDXL的完整工作流------它比SD 1.5复杂不少,但出图质量有质的飞跃。注意SDXL对显存要求更高(建议12GB+)。
第56-60天:Flux模型
Flux是Stability AI更新的扩散模型。Flux Kontext等版本支持多图参考输入。学习如何在ComfyUI中加载和使用Flux模型,体验最新架构的能力边界。
模块八:视频生成与多模态(第61-70天)
第61-65天:AnimateDiff------让图片动起来
AnimateDiff是ComfyUI中实现视频生成的核心插件。学习搭建从文生图到视频生成的完整工作流------输入一段提示词,输出几秒钟的动态视频。参数调优是重点:帧数、帧率、运动幅度,每一个都会影响最终效果。
第66-70天:IP-Adapter与多参考图处理
IP-Adapter可以实现人脸特征绑定、风格迁移等高级功能。学习多图输入的处理技巧------当需要处理多张参考图时,用Image Stitch节点将它们拼接成一张,再输入到模型中。支持水平/垂直拼接,可以设置间距和对齐方式。
模块九:调试与问题排查(第71-80天)
第71-75天:常见问题排查方法论
系统总结ComfyUI的常见问题和排查方法:
- 节点无输出:检查上游节点是否连接、参数是否正确、数据格式是否匹配
- 显存溢出:降低分辨率、减少批次数、使用xformers加速
- 生成结果不理想:调整Steps、CFG、采样器,检查提示词质量
- 模型加载失败:检查路径、文件格式、SHA256校验
第76-80天:搭建你的第一个"商业级"工作流
综合运用前三个阶段学到的所有技能,搭建一个完整的、可直接投入使用的商业级工作流。比如:
- 电商商品图自动化生成工作流:输入商品图和描述,自动生成多角度展示图
- 一键高清商业出图工作流:包含风格锁定、细节补全、商用降噪、智能构图四大模块
这个工作流应该具备:模块化设计、参数可视化调节、批处理能力、错误处理机制。
第三阶段结束,你应该已经是一个"能打"的ComfyUI使用者了。
第四阶段:精通与自主探索(第81-100天)------能独立开发、能持续成长
这一阶段的目标是:从"使用者"变成"创造者"。
模块十:自定义节点开发(第81-90天)
第81-85天:理解ComfyUI的架构
深入学习ComfyUI的架构设计、节点通信机制和扩展开发方法。理解一个节点是如何被定义、注册和执行的。看懂ComfyUI的核心代码结构------不要求你能从头写一个,但至少要能读懂和修改。
第86-90天:开发你的第一个自定义节点
跟随官方文档或社区教程,开发一个简单的自定义节点。可以从最基础的开始------比如一个"图像亮度调整"节点,或者"文本拼接"节点。成功注册并运行的那一刻,你就从一个"使用者"变成了"贡献者"。
模块十一:社区融入与持续学习(第91-100天)
第91-95天:建立你的学习网络
- 关注ComfyUI的GitHub仓库更新
- 加入ComfyUI相关的Discord、Reddit社区
- 收藏优质的教程博客(CSDN、知乎、Medium)
- 在Civitai上关注你喜欢的模型和工作流作者
第96-100天:输出倒逼输入
开始写自己的技术博客,分享你搭建的工作流和踩过的坑。把你自己整理的工作流上传到社区。教别人是最好的学习方式------当你需要向别人解释一个概念的时候,你才会发现自己到底有没有真正理解。
最后的建议:永远保持好奇
100天不是终点。AI绘画领域的发展速度超乎想象------新的模型、新的插件、新的架构层出不穷。ComfyUI生态中值得深入的方向还有很多:3D生成、动态提示词批量渲染、云端部署与团队协作......
这份100天的规划,只是帮你打开了这扇门。门后面的世界,等你自己去探索。
附录:学习资源推荐
官方文档与社区:
- ComfyUI GitHub仓库(源码+文档)
- ComfyUI Wiki(社区维护的教程集合)
- ComfyUI-Manager(插件管理的必备工具)
优质教程系列:
- CSDN上"ComfyUI全面掌握"系列(6大章节31篇)
- "ComfyUI大师之路:四阶段学习图谱"
- B站上的ComfyUI入门视频教程
模型下载:
- Civitai(最主流的模型社区)
- Hugging Face(官方模型仓库)
必备插件(按学习阶段逐步安装):
- ComfyUI-Manager(必装)
- ComfyUI-Custom-Scripts(效率提升)
- UltimateSDUpscale(超分)
- ADetailer(面部修复)
- AnimateDiff(视频生成)
最后说一句:不用追求100天"按时完成"。 学习不是比赛,有些人第30天就已经卡在了LoRA加载上,有些人第80天还在跟ControlNet死磕------这都很正常。重要的是你每天都在往前走,哪怕只是一小步。
ComfyUI的学习曲线确实陡峭,但翻过这座山之后,你会看到一个完全不同的世界------一个你可以随心所欲地设计和控制AI创作流程的世界。希望这份规划能陪你走完这段旅程。
共勉。