【AI学习-comfyUI学习-第二十九节-instantID+IP加载器预工作流-各个部分学习】

AI学习-comfyUI学习-第二十九节-instantID+IP加载器预工作流-各个部分学习

1,前言

最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。

2,说明

1,第二十九节-instantID-IP加载器预设选择XL工作流

把"人脸"干净、稳定、可控地提取出来,作为 InstantID 的身份输入

bash 复制代码
人脸图 A / B
   ↓
FaceAnalysis(InsightFace)
   ↓
FaceBBox(裁脸 / 定位)
   ↓
(可选)人脸对齐 / 合成
   ↓
InstantID 面部分析
   ↓
输出给后续 InstantID 应用节点

2,第二十九节2.instantID工作流

用一张参考人脸照片 → 提取人脸身份特征(InstantID) → 结合文本提示词 → 在生成新图时强制"长得像这个人"

bash 复制代码
参考人脸图
   ↓
InstantID 人脸分析(提取身份特征)
   ↓
InstantID + ControlNet(把"这个人是谁"强行塞进生成过程)
   ↓
KSampler 采样生成
   ↓
VAE 解码
   ↓
保存图片

3,流程

1-第二十九节-instantID-IP加载器预设选择XL工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
1girl

(3)生成图片

(1)原图片-参考图片

(2)生成图片

(4)模型选择

2-第二十八节2-InstantID(参考风格)工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
beautiful natural scenery, crystal glass bottle, dreamy landscape, cosmic nebula inside bottle, purple and blue galaxy glow

(3)生成图片

(1)原图片-参考图

(2)生成图片

(4)使用模型

4,模块部分说明

1「InstantID 面部分析」

作用(非常关键):

  • 从照片里 抽取人脸身份向量(embedding)
  • 本质是:"人脸身份证"

输入:

  • 人脸图片

输出:

  • InstantID
  • InsightFace
  • 人脸关键点 / 结构信息

👉 后面所有"像不像这个人",都靠这里


2「InstantID 文件(ip-adapter.bin)」

作用:

  • InstantID 的 身份适配模型
  • 类似 LoRA,但专门用于 人脸身份

你可以理解为:

"这是 InstantID 能听懂'人是谁'的翻译器"


3「应用 InstantID(高级)」------⭐ 核心节点 ⭐

这是整张图的灵魂

把下面几种东西 合并

  • 人是谁(InstantID)
  • 人脸结构(InsightFace)
  • 场景与风格(CLIP 文本)
  • 扩散控制(ControlNet)

4 FaceAnalysis(InsightFace)

作用:

  • 使用 InsightFace 做人脸检测与分析

  • 输出的是:

    • 人脸框
    • 关键点
    • 人脸结构信息

参数说明:

  • 库:insightface
  • 设备:CPU(OK 的,做人脸分析不吃显存)

👉 这是 InstantID 的前提条件


5 面部BBox(FaceBBox)

这是一个非常关键、但很多人忽略的节点

  • 根据 FaceAnalysis 的结果

  • 精确裁出"脸的区域"

  • 保证:

    • 脸在画面正中
  • 分区:0

  • 分区百分比:0.00

  • 索引:-1(自动选脸)

👉 含义一句话:

"只拿脸,不要背景"

这一步对:

  • 身份稳定
  • 脸不跑偏
    极其重要。

6 图像组合批次

作用:

  • 把多张裁好的人脸图
    → 合并成一个批次

为什么要这样做?

  • InstantID 支持多脸 embedding

  • 多张脸 =

    • 更稳定的身份特征
    • 抗表情 / 光照 / 角度变化

👉 这一步是 "InstantID 高质量用法"


5,细节部分

6,工作流链接

(1)第二十九节-instantID-IP加载器预设选择XL工作流
https://download.csdn.net/download/qq_22146161/92516694

(2)第二十九节2.instantID工作流
https://download.csdn.net/download/qq_22146161/92516693

7,总结

不断学习摸索中。

相关推荐
uesowys19 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_567819 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子19 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer
执笔论英雄19 小时前
【大模型学习cuda】入们第一个例子-向量和
学习
wdfk_prog19 小时前
[Linux]学习笔记系列 -- [drivers][input]input
linux·笔记·学习
智驱力人工智能19 小时前
小区高空抛物AI实时预警方案 筑牢社区头顶安全的实践 高空抛物检测 高空抛物监控安装教程 高空抛物误报率优化方案 高空抛物监控案例分享
人工智能·深度学习·opencv·算法·安全·yolo·边缘计算
qq_1601448719 小时前
亲测!2026年零基础学AI的入门干货,新手照做就能上手
人工智能
Howie Zphile19 小时前
全面预算管理难以落地的核心真相:“完美模型幻觉”的认知误区
人工智能·全面预算
人工不智能57719 小时前
拆解 BERT:Output 中的 Hidden States 到底藏了什么秘密?
人工智能·深度学习·bert
盟接之桥19 小时前
盟接之桥说制造:引流品 × 利润品,全球电商平台高效产品组合策略(供讨论)
大数据·linux·服务器·网络·人工智能·制造