【AI学习-comfyUI学习-三十六节-黑森林-融合+扩图工作流-各个部分学习】

AI学习-comfyUI学习-三十六节-黑森林-融合+扩图工作流-各个部分学习

1,前言

最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。

2,说明

1,第三十六节2-黑森林融合工作流

这是一个「以图片为主导、文字为辅助」的高稳定人像风格融合工作流

目标不是"靠 Prompt 捏人",而是:

👉 在不毁脸的前提下,迁移风格、气质、光影

图像说了算,Prompt 只是在微调态度

bash 复制代码
人脸参考图
   ↓
CLIP Vision(提取视觉特征)
   ↓
条件融合(和文字 & 风格合并)
   ↓
FLUX UNet 生成
   ↓
VAE 解码
   ↓
输出对比 / 保存

2,第三十六节3-黑深林扩图工作流

这是一组「外补画板(Outpainting)+ 内补模型条件(Inpainting Conditioning)」节点,

用于:在指定区域内进行可控重绘 / 融合,而不是整张图重新生成。

bash 复制代码
原始图像
   ↓
外补画板
   → 定义可编辑区域 + 遮罩
   ↓
内补模型条件
   → 只在遮罩区域重绘
   ↓
输出给采样器

3,流程

1-第三十六节2-黑森林融合工作流

(1)调用模块

(2)输出 提示词

这里提示词对 图片几乎没有影响

bash 复制代码
high-end commercial portrait photography,
soft cinematic lighting,
clean and elegant beauty style,
natural skin texture with subtle blush,
professional makeup with gentle color contrast,
shallow depth of field,
soft background bokeh,
luxury cosmetic advertising look,
calm, refined, premium atmosphere,
ultra-detailed, high quality, realistic

(3)生成图片

(1)原图片


(2)生成图片

(4)模型选择

2-第三十六节3-黑深林扩图工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
A professional woman is standing on the street, ready to conduct an interview.


A professional woman is standing on the street, ready to conduct an interview.

(3)生成图片

(1)原图片+遮罩-参考图

(2)生成图片

(4)使用模型

4,模块部分说明

1 CLIP Vision(最关键的节点)

这是整个工作流的灵魂节点

把「图像」转换成模型能理解的 视觉语义条件

不是像素,而是类似:

  • "这是一个温柔风格的人"
  • "这是商业人像"
  • "这是偏真实摄影"

因为:

  • CLIP Vision ≠ 建议
  • CLIP Vision ≈ 硬约束

📌 所以你后来发现:

Prompt 怎么改都不太变

👉 100% 正常


2 FLUX UNet(为什么它这么"听话")

FLUX 的特点你已经真实体会到了:

  • 不容易崩
  • 不乱改脸
  • 对参考图极度忠诚

📌 所以它非常适合

  • 商业人像
  • 稳定角色
  • 品牌视觉

但代价是:

Prompt 改动必须"很极端"才能看见变化


3 外补画板(#33)

这是一个非常重要但容易被误解的节点

它的功能不是"补画内容",而是:

定义一个「可以被重新生成的区域」


参数解释(逐个)

参数 含义(人话)
左 / 上 / 右 / 下 从原图边缘向内裁掉多少像素
羽化 = 40 重绘区域与原图的"过渡柔和度"

📌 你现在这组值的含义是:

  • 中间区域基本不动
  • 边缘 / 指定区域可以被重绘
  • 边界是 柔和融合,而不是一刀切

输入输出关系

  • 输入:

    • 原始图像
  • 输出:

    • 图像(带可编辑区域)
    • 遮罩(mask)

📌 这一步只是"画施工围栏",还没真的动工


4 内补模型条件(#26)

这是真正"动工"的地方

它在做什么?

把「图像 + 遮罩 + VAE + 正负条件」

👉 转换成 "只能在遮罩区域重绘的 latent"


接口说明(非常重要)

接口 作用
正面条件 你希望重绘区域"往哪变"
负面条件 你不希望出现什么
VAE 如何理解图像
图像 原始参考
遮罩 哪些地方可以改
噪波遮罩 = true 遮罩区允许重新注入噪声


5,细节部分

1 输入 提示词:融合时没有影响(暂时)

这里提示词对 图片几乎没有影响

6,工作流链接

(1)第三十六节2-黑森林融合工作流
https://download.csdn.net/download/qq_22146161/92575271

(2)第三十六节3-黑深林扩图工作流
https://download.csdn.net/download/qq_22146161/92575272

7,总结

不断学习摸索中。

相关推荐
大龄程序员狗哥17 小时前
第47篇:使用Speech-to-Text API快速构建语音应用(操作教程)
人工智能
KKKlucifer17 小时前
数据安全合规自动化:策略落地、审计追溯与风险闭环技术解析
人工智能·安全
RWKV元始智能18 小时前
RWKV超并发项目教程,RWKV-LM训练提速40%
人工智能·rnn·深度学习·自然语言处理·开源
dyj09518 小时前
Dify - (一)、本地部署Dify+聊天助手/Agent
人工智能·docker·容器
墨染天姬18 小时前
【AI】Hermes的GEPA算法
人工智能·算法
小超同学你好18 小时前
OpenClaw 深度解析系列 · 第8篇:Learning & Adaptation(学习与自适应)
人工智能·语言模型·chatgpt
紫微AI18 小时前
前端文本测量成了卡死一切创新的最后瓶颈,pretext实现突破了
前端·人工智能·typescript
码途漫谈18 小时前
Easy-Vibe开发篇阅读笔记(四)——前端开发之结合 Agent Skills 美化界面
人工智能·笔记·ai·开源·ai编程
易连EDI—EasyLink18 小时前
易连EDI–EasyLink实现OCR智能数据采集
网络·人工智能·安全·汽车·ocr·edi
冬奇Lab18 小时前
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
人工智能·langchain·llm