【AI学习-comfyUI学习-第二十九节-instantID+IP加载器预工作流-各个部分学习】

AI学习-comfyUI学习-第二十九节-instantID+IP加载器预工作流-各个部分学习

1,前言

最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。

2,说明

1,第二十九节-instantID-IP加载器预设选择XL工作流

把"人脸"干净、稳定、可控地提取出来,作为 InstantID 的身份输入

bash 复制代码
人脸图 A / B
   ↓
FaceAnalysis(InsightFace)
   ↓
FaceBBox(裁脸 / 定位)
   ↓
(可选)人脸对齐 / 合成
   ↓
InstantID 面部分析
   ↓
输出给后续 InstantID 应用节点

2,第二十九节2.instantID工作流

用一张参考人脸照片 → 提取人脸身份特征(InstantID) → 结合文本提示词 → 在生成新图时强制"长得像这个人"

bash 复制代码
参考人脸图
   ↓
InstantID 人脸分析(提取身份特征)
   ↓
InstantID + ControlNet(把"这个人是谁"强行塞进生成过程)
   ↓
KSampler 采样生成
   ↓
VAE 解码
   ↓
保存图片

3,流程

1-第二十九节-instantID-IP加载器预设选择XL工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
1girl

(3)生成图片

(1)原图片-参考图片

(2)生成图片

(4)模型选择

2-第二十八节2-InstantID(参考风格)工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
beautiful natural scenery, crystal glass bottle, dreamy landscape, cosmic nebula inside bottle, purple and blue galaxy glow

(3)生成图片

(1)原图片-参考图

(2)生成图片

(4)使用模型

4,模块部分说明

1「InstantID 面部分析」

作用(非常关键):

  • 从照片里 抽取人脸身份向量(embedding)
  • 本质是:"人脸身份证"

输入:

  • 人脸图片

输出:

  • InstantID
  • InsightFace
  • 人脸关键点 / 结构信息

👉 后面所有"像不像这个人",都靠这里


2「InstantID 文件(ip-adapter.bin)」

作用:

  • InstantID 的 身份适配模型
  • 类似 LoRA,但专门用于 人脸身份

你可以理解为:

"这是 InstantID 能听懂'人是谁'的翻译器"


3「应用 InstantID(高级)」------⭐ 核心节点 ⭐

这是整张图的灵魂

把下面几种东西 合并

  • 人是谁(InstantID)
  • 人脸结构(InsightFace)
  • 场景与风格(CLIP 文本)
  • 扩散控制(ControlNet)

4 FaceAnalysis(InsightFace)

作用:

  • 使用 InsightFace 做人脸检测与分析

  • 输出的是:

    • 人脸框
    • 关键点
    • 人脸结构信息

参数说明:

  • 库:insightface
  • 设备:CPU(OK 的,做人脸分析不吃显存)

👉 这是 InstantID 的前提条件


5 面部BBox(FaceBBox)

这是一个非常关键、但很多人忽略的节点

  • 根据 FaceAnalysis 的结果

  • 精确裁出"脸的区域"

  • 保证:

    • 脸在画面正中
  • 分区:0

  • 分区百分比:0.00

  • 索引:-1(自动选脸)

👉 含义一句话:

"只拿脸,不要背景"

这一步对:

  • 身份稳定
  • 脸不跑偏
    极其重要。

6 图像组合批次

作用:

  • 把多张裁好的人脸图
    → 合并成一个批次

为什么要这样做?

  • InstantID 支持多脸 embedding

  • 多张脸 =

    • 更稳定的身份特征
    • 抗表情 / 光照 / 角度变化

👉 这一步是 "InstantID 高质量用法"


5,细节部分

6,工作流链接

(1)第二十九节-instantID-IP加载器预设选择XL工作流
https://download.csdn.net/download/qq_22146161/92516694

(2)第二十九节2.instantID工作流
https://download.csdn.net/download/qq_22146161/92516693

7,总结

不断学习摸索中。

相关推荐
陈广亮1 天前
构建具有长期记忆的 AI Agent:从设计模式到生产实践
人工智能
会写代码的柯基犬1 天前
DeepSeek vs Kimi vs Qwen —— AI 生成俄罗斯方块代码效果横评
人工智能·llm
Mintopia1 天前
OpenClaw 是什么?为什么节后热度如此之高?
人工智能
爱可生开源社区1 天前
DBA 的未来?八位行业先锋的年度圆桌讨论
人工智能·dba
叁两1 天前
用opencode打造全自动公众号写作流水线,AI 代笔太香了!
前端·人工智能·agent
前端付豪1 天前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
strayCat232551 天前
Clawdbot 源码解读 7: 扩展机制
人工智能·开源
王鑫星1 天前
SWE-bench 首次突破 80%:Claude Opus 4.5 发布,Anthropic 的野心不止于写代码
人工智能
lnix1 天前
当“大龙虾”养在本地:我们离“反SaaS”的AI未来还有多远?
人工智能·aigc