ComfyUI 使用指南:AI 图像生成工作流详解 | 2025 年第 14 周草梅周报

本文在 草梅友仁的博客 发布和更新,并在多个平台同步发布。如有更新,以博客上的版本为准。您也可以通过文末的 原文链接 查看最新版本。

前言

欢迎来到草梅周报!这是一个由草梅友仁基于 AI 整理的周报,旨在为您提供最新的博客更新、GitHub 动态、个人动态和其他周刊文章推荐等内容。


上期周报推荐过 comfyanonymous/ComfyUI ,一个强大的和模块化的可视化 AI 引擎和应用程序,通过管道来稳定的生成 AI 图片。

本期来研究下 ComfyUI 具体的使用。

首先,ComfyUI 相较于 Stable Diffusion Web UI 最大的改进就是添加了节点式工作流设计。

ComfyUI 通过节点(如 Checkpoint 加载器、K 采样器、ControlNet 应用等)构建图像生成流程,可以精确掌握图像生成的细节,控制图像生成的质量。

以经典的文生图为例,通过组装 Checkpoint 加载器、K 采样器、VAE 解码器等节点,就可以实现跟 Stable Diffusion Web UI 类似的效果,当然了,也可以添加放大模型节点,实现类似的图片放大效果。

当然了,文生图有了,图生图也自然少不了。

图生图跟文生图唯一的区别就是修改 Latent 图像来源,从空 Latent 图像改成从指图像加载。

除了节点式工作流的设计之外,ComfyUI 对 GPU 显存要求显著降低,3G 以下仍可正常运行。

当然了,对新人而言,还可以直接导入大佬制作好的工作流,简化自己搭建工作流的流程。

虽然 ComfyUI 等工作流式的设计在 GPT-4o 等模型出来后看起来会有点麻烦,不过我依然认为,要想精确控制图像生成的话,还是得走类似工作流的模式,这样才能控制最终产物。

当然了,对画师而言,我想 AI 大模型不应该直接生成图片,而是生成 PSD 等图片工程文件,一个没有分层的图片显然是不具备项目价值的。

参考人类绘画的流程,从草稿到成品,每一步都可以有 AI 参与,但 AI 绝不能直接生成成品,无论是出于控制产物的角度还是出于考虑人类自身价值的角度。

对小说、编程等内容,文本本身就是工程文件,修改起来也较为简单。

但 png/jpg 等图片文件,并不是图片工程文件,要修改的门槛也更高。

我猜,未来普通人或者专业画师,在使用 AI 绘画上的区别就是参与程度如何,普通人可能更关心最终产物,而专业画师会更关心整体流程。

一个可能的工作流程就是:GPT-4o 生成参考图片 -> 人类反馈 ->GPT-4o 进一步修改 -> 相对满意后,生成并导出 PSD 工程文件 ->人类画师手动修改。

就像程序员把 AI 当编程助手,让它生成代码,生成测试用例;画师其实也要把 AI 当绘画助手,让它生成线稿,生成上色效果等。

在这 AI 的时代,任何行业都不可能独善其身,唯有继续学习,才能在 AI 时代的洪流下继续前进。

GitHub Release

v1.4.1 - 2025-04-03 21:40:43

摘要: 版本 1.4.1 更新摘要

Bug 修复:

  • 修改缓存时间设置为 3600 秒
  • 更新依赖项配置

最新 GitHub 加星仓库

  • CaoMeiYouRen starred ComfyUI - 2025-03-30 19:43:23 这是一个功能强大且模块化的扩散模型图形用户界面(GUI)、应用程序接口(API)和后端系统,采用图/节点接口设计。主要编程语言为 Python。该项目在 GitHub 上获得了 73,468 颗星,显示出其广泛的受欢迎程度和社区支持。

其他博客或周刊推荐

潮流周刊

二丫讲梵的学习周刊

总结

本周的更新和动态如上所示。感谢您的阅读! 您可以通过以下方式订阅草梅周报的更新:

往期回顾

本文作者:草梅友仁

本文地址:blog.cmyr.ltd/archives/20...

版权声明:本文采用 CC BY-NC-SA 4.0 协议 进行分发,转载请注明出处!

相关推荐
非鱼feiyu4 小时前
从入门到实践:构建你的第一个 MCP Server
llm·aigc·mcp
struggleupwards4 小时前
耗费三个月,开发了一款博客
开源·github·全栈
时序数据说5 小时前
时序数据库IoTDB如何快速高效地存储时序数据
大数据·数据库·开源·时序数据库·iotdb
中国lanwp6 小时前
本地Markdown开源知识库选型指南
开源
从零开始学习人工智能8 小时前
支持向量机(SVM):解锁数据分类与回归的强大工具
人工智能·性能优化·开源
xiaohezi8 小时前
RAG 系统文本切分:从固定长度到智能检索的六种方法解析
aigc
墨风如雪8 小时前
重磅炸弹!字节跳动开源BAGEL:70亿参数,统一多模态理解与生成,AI“全能王”诞生记!
aigc
武子康10 小时前
AI炼丹日志-25 - OpenAI 开源的编码助手 Codex 上手指南
人工智能·gpt·ai·语言模型·自然语言处理·开源
CCF ODC11 小时前
【2025CCF中国开源大会】RISC-V 开源生态的挑战与机遇分论坛重磅来袭!共探开源芯片未来
开源·risc-v
寻月隐君11 小时前
用 Rust 打造命令行利器:从零到一实现 mini-grep
后端·rust·github