【AI学习-comfyUI学习-三十二节-FLXU原生态反推+controlnet depth(UNion)工作流-各个部分学习】

@[TOC](AI学习-comfyUI学习-三十二节-FLXU原生态反推+controlnet depth(UNion)工作流-各个部分学习)

1,前言

最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。

2,说明

1,第三十二节-FLXU原生态反推工作流

输入图片 → JoyCaption 自动反推描述 → 送入 FLUX 双 CLIP 条件 → KSampler 生成 → VAE 解码 → 保存

bash 复制代码
【模型加载】
 UNet + 双CLIP + VAE
        ↓
【输入图像】
        ↓
【VAE 编码 → Latent】
        ↓
【JoyCaption 自动生成 prompt】
        ↓
【CLIP 文本编码(正 / 负)】
        ↓
【KSampler(FLUX)】
        ↓
【VAE 解码 → Image】
        ↓
【保存】

这是一个:自动理解图片 → 自动写 prompt → 再用 FLUX 高质量重绘的 pipeline

2,第三十二节2-FLUX controlnet depth(UNion)模型工作流

原图 → DepthAnything 抽几何 → ControlNet Union(depth) 锁结构

→ JoyCaption 生成语义 → CLIP 控制风格

→ FLUX 低 CFG 采样 → 高一致性重绘

3,流程

1-第三十二节-FLXU原生态反推工作流

(1)调用模块

(2)输出 提示词

输出得提示词,自动生成

bash 复制代码
1girls, blue_eyes, weapon, full body, sky, boobs, looking at viewer, black pants, parted lips, white hair, bangs, white gloves, black gloves, holding, black footwear, snow, long hair, black jacket, long sleeve, photoshop (medium), thigh boots, holding weapon, long gloves, black_blouse, holding sword, solo, parted_bangs, cleavage, black leotard, sfw, leotard, bare shoulder, holding gun, ponytail, jacket, weapon over shoulder, bare arms, large_breasts, armpit, hair ornament, white blouse, thighhighs, long ponytail, original, blue sky, hair between eyes, gun, black hair, gloves, white hairband, black hairband, armour, swords, snowing, white hairband, 1other, long hair tied low, blue hairband, hairband, snowing hairband, blush, weapon on shoulder, black gloves, weapon on head, hair accessory, thigh strap, tits apart, hair between breasts, weapon on headwear, white_gloves, holding weapon over shoulder, weapon over head, snowing hair, hair between fingers, pants, hair intakes, blue eyes, armour on shoulders, white hairband, hair between legs, holding weapon over head, hair between thighs, armour_between_breasts, holding weapon between legs, hair between, hair between elbows, armour on forearms, armour_between

(3)生成图片

(1)原图片

(2)生成图片

(4)模型选择

2-第三十二节2-FLUX controlnet depth(UNion)模型工作流

(1)调用模块

(2)输出 提示词

bash 复制代码
Chinese style high quality character render, cinematic fantasy artwork,
dynamic action pose, strong sense of motion,
sharp focus, high contrast lighting,
detailed fabric texture, realistic skin detail,
professional concept art quality,
clean lighting, no illustration texture,
dramatic lighting, clear depth separation


painterly, illustration, sketch, watercolor,
flat lighting, dull colors, gray tone,
paper texture, canvas texture,
low contrast, blurry, low detail

(3)生成图片

(1)原图片-参考图

(2)生成图

(4)使用模型

4,模块部分说明

1 JoyCaption 自动反推(核心亮点)

🔹 Joy Caption Two Load
  • 使用模型:unsloth/Meta-Llama-3.1-8B-bnb-4bit
  • 管道:JoyTwoPipeline

这是:

LLM + Vision Encoder 的图像描述模型


🔹 JoyCaption Two(参数)
参数 含义
caption_type Descriptive
caption_length long
low_vram false

👉 输出的是 长、完整、偏自然语言的描述

📌 这一步 = 自动写 prompt


🔹 输出去向
  • 输出 STRING
  • 直接送入下面的 CLIP 文本编码器

2 CLIP 文本编码(FLUX 专用)

你这里有 两个一模一样的节点

🔹 CLIP 文本编码(Flux)×2
  • 上:正向 prompt
  • 下:负向 prompt

参数:

复制代码
权重:3.5

3 DownloadAndLoadDepthAnythingV2Model

看到的参数

text 复制代码
model: depth_anything_v2_vitl_fp32.safetensors
precision: auto

作用一句话:

加载 Depth Anything V2 的深度预测模型(本体),供后续节点使用。


🔍 关键点逐条解释

🔹 model:depth_anything_v2_vitl_fp32

  • Depth Anything V2

    • 当前最强、最稳定的通用深度估计模型之一
  • vitl

    • Vision Transformer Large

    • 比 base / small:

      • 边缘更准
      • 人体轮廓更干净
      • 前后层次更稳定
  • fp32

    • 精度最高
    • 深度连续性最好(适合 ControlNet)

📌 结论:

这是"质量优先"的正确选择

代价只是显存和速度。


🔹 precision:auto

含义:

  • 如果显存够 → fp32
  • 显存紧 → 自动降精度

👉 对深度图质量几乎没负面影响

✔️ 推荐保持 auto


它只:

  • 加载模型
  • 输出一个 da_model(深度模型句柄)

5,细节部分

1-图片识别能力

有时候调试很久,一直要不到感觉质量好的图,可能使用得图片就太难了

6,工作流链接

(1)第三十二节-FLXU原生态反推工作流
https://download.csdn.net/download/qq_22146161/92554564

(2)第三十二节2-FLUX controlnet depth(UNion)模型工作流
https://download.csdn.net/download/qq_22146161/92554566

7,总结

不断学习摸索中。

相关推荐
peixiuhui3 小时前
EdgeGateway 快速开始手册-表达式 Modbus 报文格式
人工智能·mqtt·边缘计算·iot·modbus tcp·iotgateway·modbus rtu
好奇龙猫3 小时前
【大学院-筆記試験練習:数据库(データベース問題訓練) と 软件工程(ソフトウェア)(7)】
学习
bing.shao3 小时前
golang 做AI任务执行
开发语言·人工智能·golang
鼎道开发者联盟4 小时前
2025中国AI开源生态报告发布,鼎道智联助力产业高质量发展
人工智能·开源·gui
贾维思基4 小时前
告别RPA和脚本!视觉推理Agent,下一代自动化的暴力解法
人工智能·agent
P-ShineBeam4 小时前
引导式问答-对话式商品搜索-TRACER
人工智能·语言模型·自然语言处理·知识图谱
j_jiajia4 小时前
(一)人工智能算法之监督学习——KNN
人工智能·学习·算法
Hcoco_me4 小时前
大模型面试题62:PD分离
人工智能·深度学习·机器学习·chatgpt·机器人
2301_783360134 小时前
关于RNAseq——从fastq到gene_counts全流程
笔记·学习