AI学习-comfyUI学习-三十六节-黑森林-融合+扩图工作流-各个部分学习
- 1,前言
- 2,说明
- 3,流程
- 4,模块部分说明
-
- [1 CLIP Vision(最关键的节点)](#1 CLIP Vision(最关键的节点))
- [2 FLUX UNet(为什么它这么"听话")](#2 FLUX UNet(为什么它这么“听话”))
- 3 外补画板(#33)
- 4 内补模型条件(#26)
- 5,细节部分
-
- [1 输入 提示词:融合时没有影响(暂时)](#1 输入 提示词:融合时没有影响(暂时))
- 6,工作流链接
- 7,总结
1,前言
最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。
2,说明
1,第三十六节2-黑森林融合工作流
这是一个「以图片为主导、文字为辅助」的高稳定人像风格融合工作流
目标不是"靠 Prompt 捏人",而是:
👉 在不毁脸的前提下,迁移风格、气质、光影
图像说了算,Prompt 只是在微调态度
bash
人脸参考图
↓
CLIP Vision(提取视觉特征)
↓
条件融合(和文字 & 风格合并)
↓
FLUX UNet 生成
↓
VAE 解码
↓
输出对比 / 保存
2,第三十六节3-黑深林扩图工作流
这是一组「外补画板(Outpainting)+ 内补模型条件(Inpainting Conditioning)」节点,
用于:在指定区域内进行可控重绘 / 融合,而不是整张图重新生成。
bash
原始图像
↓
外补画板
→ 定义可编辑区域 + 遮罩
↓
内补模型条件
→ 只在遮罩区域重绘
↓
输出给采样器
3,流程
1-第三十六节2-黑森林融合工作流
(1)调用模块

(2)输出 提示词
这里提示词对 图片几乎没有影响
bash
high-end commercial portrait photography,
soft cinematic lighting,
clean and elegant beauty style,
natural skin texture with subtle blush,
professional makeup with gentle color contrast,
shallow depth of field,
soft background bokeh,
luxury cosmetic advertising look,
calm, refined, premium atmosphere,
ultra-detailed, high quality, realistic

(3)生成图片
(1)原图片


(2)生成图片

(4)模型选择


2-第三十六节3-黑深林扩图工作流
(1)调用模块

(2)输出 提示词
bash
A professional woman is standing on the street, ready to conduct an interview.
A professional woman is standing on the street, ready to conduct an interview.

(3)生成图片
(1)原图片+遮罩-参考图

(2)生成图片

(4)使用模型


4,模块部分说明
1 CLIP Vision(最关键的节点)
这是整个工作流的灵魂节点。
把「图像」转换成模型能理解的 视觉语义条件
不是像素,而是类似:
- "这是一个温柔风格的人"
- "这是商业人像"
- "这是偏真实摄影"
因为:
- CLIP Vision ≠ 建议
- CLIP Vision ≈ 硬约束
📌 所以你后来发现:
Prompt 怎么改都不太变
👉 100% 正常
2 FLUX UNet(为什么它这么"听话")
FLUX 的特点你已经真实体会到了:
- 不容易崩
- 不乱改脸
- 对参考图极度忠诚
📌 所以它非常适合:
- 商业人像
- 稳定角色
- 品牌视觉
但代价是:
Prompt 改动必须"很极端"才能看见变化
3 外补画板(#33)
这是一个非常重要但容易被误解的节点。
它的功能不是"补画内容",而是:
定义一个「可以被重新生成的区域」
参数解释(逐个)
| 参数 | 含义(人话) |
|---|---|
| 左 / 上 / 右 / 下 | 从原图边缘向内裁掉多少像素 |
| 羽化 = 40 | 重绘区域与原图的"过渡柔和度" |
📌 你现在这组值的含义是:
- 中间区域基本不动
- 边缘 / 指定区域可以被重绘
- 边界是 柔和融合,而不是一刀切
输入输出关系
-
输入:
- 原始图像
-
输出:
- 图像(带可编辑区域)
- 遮罩(mask)
📌 这一步只是"画施工围栏",还没真的动工。
4 内补模型条件(#26)
这是真正"动工"的地方。
它在做什么?
把「图像 + 遮罩 + VAE + 正负条件」
👉 转换成 "只能在遮罩区域重绘的 latent"
接口说明(非常重要)
| 接口 | 作用 |
|---|---|
| 正面条件 | 你希望重绘区域"往哪变" |
| 负面条件 | 你不希望出现什么 |
| VAE | 如何理解图像 |
| 图像 | 原始参考 |
| 遮罩 | 哪些地方可以改 |
| 噪波遮罩 = true | 遮罩区允许重新注入噪声 |
5,细节部分
1 输入 提示词:融合时没有影响(暂时)
这里提示词对 图片几乎没有影响
6,工作流链接
(1)第三十六节2-黑森林融合工作流
https://download.csdn.net/download/qq_22146161/92575271
(2)第三十六节3-黑深林扩图工作流
https://download.csdn.net/download/qq_22146161/92575272
7,总结
不断学习摸索中。