【AI学习-comfyUI学习-三十六节-黑森林-融合+扩图工作流-各个部分学习】

AI学习-comfyUI学习-三十六节-黑森林-融合+扩图工作流-各个部分学习

1,前言

最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。

2,说明

1,第三十六节2-黑森林融合工作流

这是一个「以图片为主导、文字为辅助」的高稳定人像风格融合工作流

目标不是"靠 Prompt 捏人",而是:

👉 在不毁脸的前提下,迁移风格、气质、光影

图像说了算,Prompt 只是在微调态度

bash 复制代码
人脸参考图
   ↓
CLIP Vision(提取视觉特征)
   ↓
条件融合(和文字 & 风格合并)
   ↓
FLUX UNet 生成
   ↓
VAE 解码
   ↓
输出对比 / 保存

2,第三十六节3-黑深林扩图工作流

这是一组「外补画板(Outpainting)+ 内补模型条件(Inpainting Conditioning)」节点,

用于:在指定区域内进行可控重绘 / 融合,而不是整张图重新生成。

bash 复制代码
原始图像
   ↓
外补画板
   → 定义可编辑区域 + 遮罩
   ↓
内补模型条件
   → 只在遮罩区域重绘
   ↓
输出给采样器

3,流程

1-第三十六节2-黑森林融合工作流

(1)调用模块

(2)输出 提示词

这里提示词对 图片几乎没有影响

bash 复制代码
high-end commercial portrait photography,
soft cinematic lighting,
clean and elegant beauty style,
natural skin texture with subtle blush,
professional makeup with gentle color contrast,
shallow depth of field,
soft background bokeh,
luxury cosmetic advertising look,
calm, refined, premium atmosphere,
ultra-detailed, high quality, realistic

(3)生成图片

(1)原图片


(2)生成图片

(4)模型选择

2-第三十六节3-黑深林扩图工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
A professional woman is standing on the street, ready to conduct an interview.


A professional woman is standing on the street, ready to conduct an interview.

(3)生成图片

(1)原图片+遮罩-参考图

(2)生成图片

(4)使用模型

4,模块部分说明

1 CLIP Vision(最关键的节点)

这是整个工作流的灵魂节点

把「图像」转换成模型能理解的 视觉语义条件

不是像素,而是类似:

  • "这是一个温柔风格的人"
  • "这是商业人像"
  • "这是偏真实摄影"

因为:

  • CLIP Vision ≠ 建议
  • CLIP Vision ≈ 硬约束

📌 所以你后来发现:

Prompt 怎么改都不太变

👉 100% 正常


2 FLUX UNet(为什么它这么"听话")

FLUX 的特点你已经真实体会到了:

  • 不容易崩
  • 不乱改脸
  • 对参考图极度忠诚

📌 所以它非常适合

  • 商业人像
  • 稳定角色
  • 品牌视觉

但代价是:

Prompt 改动必须"很极端"才能看见变化


3 外补画板(#33)

这是一个非常重要但容易被误解的节点

它的功能不是"补画内容",而是:

定义一个「可以被重新生成的区域」


参数解释(逐个)

参数 含义(人话)
左 / 上 / 右 / 下 从原图边缘向内裁掉多少像素
羽化 = 40 重绘区域与原图的"过渡柔和度"

📌 你现在这组值的含义是:

  • 中间区域基本不动
  • 边缘 / 指定区域可以被重绘
  • 边界是 柔和融合,而不是一刀切

输入输出关系

  • 输入:

    • 原始图像
  • 输出:

    • 图像(带可编辑区域)
    • 遮罩(mask)

📌 这一步只是"画施工围栏",还没真的动工


4 内补模型条件(#26)

这是真正"动工"的地方

它在做什么?

把「图像 + 遮罩 + VAE + 正负条件」

👉 转换成 "只能在遮罩区域重绘的 latent"


接口说明(非常重要)

接口 作用
正面条件 你希望重绘区域"往哪变"
负面条件 你不希望出现什么
VAE 如何理解图像
图像 原始参考
遮罩 哪些地方可以改
噪波遮罩 = true 遮罩区允许重新注入噪声


5,细节部分

1 输入 提示词:融合时没有影响(暂时)

这里提示词对 图片几乎没有影响

6,工作流链接

(1)第三十六节2-黑森林融合工作流
https://download.csdn.net/download/qq_22146161/92575271

(2)第三十六节3-黑深林扩图工作流
https://download.csdn.net/download/qq_22146161/92575272

7,总结

不断学习摸索中。

相关推荐
阿里云大数据AI技术7 分钟前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122720 分钟前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队21 分钟前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇25 分钟前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端
Token炼金师1 小时前
去噪扩散:从随机噪声到高保真图像的数学之路
人工智能·aigc
这个DBA有点耶1 小时前
AI写的SQL跑崩了生产库,这锅谁背?
数据库·人工智能·程序员
阿里云大数据AI技术2 小时前
阿里云 EMR AI 助手正式发布:从问答工具到全栈智能运维助手
运维·人工智能
Larcher2 小时前
从零搭建 MCP 服务——让 AI 拥有无限扩展能力
人工智能·程序员
zzzzzz3102 小时前
你的 AI 写的 React 烂透了?这个 8000+ Star 的开源工具能揪出 90% 的「Agent 屎山」
人工智能
小星AI2 小时前
MCP协议超详细教程,从入门到实战
人工智能