【AI学习-comfyUI学习-第二十九节-instantID+IP加载器预工作流-各个部分学习】

AI学习-comfyUI学习-第二十九节-instantID+IP加载器预工作流-各个部分学习

1,前言

最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。

2,说明

1,第二十九节-instantID-IP加载器预设选择XL工作流

把"人脸"干净、稳定、可控地提取出来,作为 InstantID 的身份输入

bash 复制代码
人脸图 A / B
   ↓
FaceAnalysis(InsightFace)
   ↓
FaceBBox(裁脸 / 定位)
   ↓
(可选)人脸对齐 / 合成
   ↓
InstantID 面部分析
   ↓
输出给后续 InstantID 应用节点

2,第二十九节2.instantID工作流

用一张参考人脸照片 → 提取人脸身份特征(InstantID) → 结合文本提示词 → 在生成新图时强制"长得像这个人"

bash 复制代码
参考人脸图
   ↓
InstantID 人脸分析(提取身份特征)
   ↓
InstantID + ControlNet(把"这个人是谁"强行塞进生成过程)
   ↓
KSampler 采样生成
   ↓
VAE 解码
   ↓
保存图片

3,流程

1-第二十九节-instantID-IP加载器预设选择XL工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
1girl

(3)生成图片

(1)原图片-参考图片

(2)生成图片

(4)模型选择

2-第二十八节2-InstantID(参考风格)工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
beautiful natural scenery, crystal glass bottle, dreamy landscape, cosmic nebula inside bottle, purple and blue galaxy glow

(3)生成图片

(1)原图片-参考图

(2)生成图片

(4)使用模型

4,模块部分说明

1「InstantID 面部分析」

作用(非常关键):

  • 从照片里 抽取人脸身份向量(embedding)
  • 本质是:"人脸身份证"

输入:

  • 人脸图片

输出:

  • InstantID
  • InsightFace
  • 人脸关键点 / 结构信息

👉 后面所有"像不像这个人",都靠这里


2「InstantID 文件(ip-adapter.bin)」

作用:

  • InstantID 的 身份适配模型
  • 类似 LoRA,但专门用于 人脸身份

你可以理解为:

"这是 InstantID 能听懂'人是谁'的翻译器"


3「应用 InstantID(高级)」------⭐ 核心节点 ⭐

这是整张图的灵魂

把下面几种东西 合并

  • 人是谁(InstantID)
  • 人脸结构(InsightFace)
  • 场景与风格(CLIP 文本)
  • 扩散控制(ControlNet)

4 FaceAnalysis(InsightFace)

作用:

  • 使用 InsightFace 做人脸检测与分析

  • 输出的是:

    • 人脸框
    • 关键点
    • 人脸结构信息

参数说明:

  • 库:insightface
  • 设备:CPU(OK 的,做人脸分析不吃显存)

👉 这是 InstantID 的前提条件


5 面部BBox(FaceBBox)

这是一个非常关键、但很多人忽略的节点

  • 根据 FaceAnalysis 的结果

  • 精确裁出"脸的区域"

  • 保证:

    • 脸在画面正中
  • 分区:0

  • 分区百分比:0.00

  • 索引:-1(自动选脸)

👉 含义一句话:

"只拿脸,不要背景"

这一步对:

  • 身份稳定
  • 脸不跑偏
    极其重要。

6 图像组合批次

作用:

  • 把多张裁好的人脸图
    → 合并成一个批次

为什么要这样做?

  • InstantID 支持多脸 embedding

  • 多张脸 =

    • 更稳定的身份特征
    • 抗表情 / 光照 / 角度变化

👉 这一步是 "InstantID 高质量用法"


5,细节部分

6,工作流链接

(1)第二十九节-instantID-IP加载器预设选择XL工作流
https://download.csdn.net/download/qq_22146161/92516694

(2)第二十九节2.instantID工作流
https://download.csdn.net/download/qq_22146161/92516693

7,总结

不断学习摸索中。

相关推荐
数模精英2 小时前
2025第十六届蓝桥杯视觉艺术设计赛
人工智能
西敏寺的乐章2 小时前
ZooKeeper 系统学习总结
分布式·学习·zookeeper
草莓熊Lotso2 小时前
Qt 入门核心指南:从框架认知到环境搭建 + Qt Creator 实战
xml·开发语言·网络·c++·人工智能·qt·页面
哦哦~9212 小时前
计算化学与人工智能驱动的 MOFs 性能预测与筛选技术
人工智能·计算化学
d111111111d2 小时前
STM32定时器中断配置详解:以TIM2为例
笔记·stm32·单片机·嵌入式硬件·学习
爱学习的uu2 小时前
大模型学习1——各类模型接入langchain,模型调用,记忆管理,工具调用
人工智能·python·深度学习·学习·算法·机器学习·langchain
安得权2 小时前
Azure DevOps 学习概况总结
学习·azure·devops
大模型真好玩2 小时前
从分享AI,到与AI共舞—大模型真好玩的2025总结
人工智能·trae·vibecoding
码农小白猿2 小时前
提升压力容器改造方案报告标准条款审核效率,IACheck助力合规与安全
运维·人工智能·安全·ai·自动化·iacheck