今天给大家演示一个 Flux Kontext 身形调优与体态增强的 ComfyUI 工作流。这个流程通过引用参考图、调节潜空间、结合定向 LoRA 与文生图控制,让人物身形的比例、胸腰臀结构、体态细节得到更自然的放大与强化。
你能直观看到输入图像在增强前后的差异,也能了解工作流如何从模型加载、文本编码、潜空间调节,一步步构建出最终的增强效果。

文章目录
工作流介绍
这个工作流围绕 Flux 系列模型展开,通过 UNet 主体模型 + 大尺寸 CLIP 文本编码 + LoRA 身形增强模块 组合构成核心生成体系。在引用参考图后,图像会被编码进潜空间,再通过 ReferenceLatent 进行结构映射,使增强后的图像在保持原始人物姿态的同时,对身形进行更突出的强化。模型输出经过 VAE 解码,再以多种对比查看方式展示最终结果。从模型、编码器到图像 Stitch、串接节点,每个部分都协作完成一次稳定且可控的身形调优。

核心模型
核心模型由 Flux Kontext 所需的 UNet 主体、Flux 专用双文本编码器、VAE 编码解码器,以及身形增强 LoRA 构成。它们共同决定文字语义的解析质量、结构保持能力与最终的体态调节幅度。特别是 LoRA 模块在模型层面提供增强指令,让身形调整能更自然融入模型风格。
| 模型名称 | 说明 |
|---|---|
| flux1-kontext-dev-Q8_0.gguf | 工作流主 UNet 模型,用于渲染核心视觉结果 |
| clip_l.safetensors / t5xxl_fp8_e4m3fn_scaled.safetensors | 双文本编码器,支撑 Flux 的语义理解与特征表达 |
| kontext_big_breasts_and_butts.safetensors | LoRA 身形增强模型,用于调整体态与比例 |
| ae.safetensors | VAE 编码与解码图像潜空间 |
Node节点
节点结构围绕 图像加载、文本编码、潜空间映射、采样、解码、对比预览与保存 一条主线展开。特殊节点如 ReferenceLatent 与 FluxGuidance 控制身形增强的参考强度,让人物保持原图姿态但体态强化更明显。图像拼接与对比节点则用于展示前后效果。
| 节点名称 | 说明 |
|---|---|
| LoadImage | 加载原始图片 |
| CLIPTextEncode | 文本提示编码 |
| ReferenceLatent | 使用原图潜空间进行结构参考 |
| FluxGuidance | 指导 Flux 的生成方向与强度 |
| KSampler | 生成图像潜空间的核心采样节点 |
| VAEDecode / VAEEncode | 图像与潜空间之间编码与解码 |
| ImageStitch / ImageConcanate | 拼接对比图像 |
| PreviewImage | 输出预览 |
| SaveImage | 保存图像 |
工作流程
整个流程从加载人物图像开始,通过双文本编码器解析提示词,再将图像经 VAE 编码进入潜空间,与 ReferenceLatent 结合形成参考结构。随后在 LoRA 调整过的模型下,通过 FluxGuidance 控制生成方向,KSampler 负责输出新的潜空间结构,再经 VAE 解码后的图像与原图进行 Stitch、拼接与滑动对比。最终用户能在预览窗口中看到体态提升前后的清晰差异,并可将增强后的结果直接导出。
| 流程序号 | 流程阶段 | 工作描述 | 使用节点 |
|---|---|---|---|
| 1 | 图像输入 | 加载原始人物图像并准备潜空间处理 | LoadImage |
| 2 | 文本解析 | 将描述性提示词转换成模型可理解的特征 | CLIPTextEncode |
| 3 | 潜空间建立 | 图像编码进潜空间,为结构保持提供基础 | VAEEncode |
| 4 | 结构参考 | 利用 ReferenceLatent 将原图姿态映射到最终生成中 | ReferenceLatent |
| 5 | 模型增强 | 加载 LoRA 并与 UNet 融合,形成体态增强模型 | UnetLoaderGGUF / LoraLoaderModelOnly |
| 6 | Flux 指导 | 控制语义引导强度,让身形增强更自然 | FluxGuidance |
| 7 | 生成采样 | 使用 KSampler 得到新的潜空间图像 | KSampler |
| 8 | 图像解码 | 将潜空间结果转换成可视化图像 | VAEDecode |
| 9 | 对比展示 | 拼接前后图像或滑动查看变化 | ImageStitch / ImageConcanate / Image Comparer (rgthree) |
| 10 | 导出成品 | 输出最终增强图像 | SaveImage |
大模型应用
CLIPTextEncode 文本语义驱动的核心解析节点
CLIPTextEncode 在整个工作流中承担语义生成的语言入口。所有的 Prompt 在这里被编码成可供模型理解的特征向量,这些特征会直接影响后续生成的风格、身体比例、增强力度与整体视觉走向。节点本身不参与图像结构调整,而是专注将用户所写的描述准确转化成深度语义信号,因此 Prompt 的清晰度、方向性和细节决定了整个生成质量。
在本工作流中,Prompt 用来指定身体特征的增强需求、强调人物体态变化,并通过语言表达出模型需要执行的视觉强化。
| 节点名称 | Prompt 信息 | 说明 |
|---|---|---|
| CLIPTextEncode | make the woman's breasts larger | 将文字描述转换为模型可读取的语义特征,用以指导后续生成方向与增强侧重点 |
使用方法
整体流程围绕"加载素材、编码语义、建立潜空间、生成增强结果"四步自动运行。用户只需要替换输入图片与 Prompt,系统会自动完成图像读取、潜空间编码、结构参考、模型采样、解码成图以及前后效果生成。角色图负责提供姿态与原始造型信息,Prompt 则控制增强方向与风格倾向,模型会根据语言指令在保持人物结构的前提下完成体态优化。用户无需手动干预各阶段节点,只要输入素材正确,流程便能自动输出增强后的人物图像与对比结果。
| 注意点 | 说明 |
|---|---|
| Prompt 越具体效果越可控 | 尽量在文本描述中清晰指出增强方向与视觉重点 |
| 输入图越清晰,结构映射越准确 | 原始图像质量会影响潜空间参考的效果 |
| 避免矛盾语义 | Prompt 内不要出现互相冲突的描述,以免生成失真 |
| LoRA 强度可影响增强幅度 | 若效果过强或过弱,可在模型相关节点中调节参数 |
| 保持人物主体完整 | 裁切过度或遮挡严重的素材不利于体态增强输出 |
应用场景
工作流适合需要对人物体态、比例、身形进行可控强化的场景。它能保留人物原本的姿态特征,又能通过 LoRA 与潜空间参考实现自然的局部增强效果。对于摄影后期、角色美化、二改创作或展示前后对比的内容制作,这套流程都能在保持真实感的前提下生成质量稳定且风格统一的成品。
| 应用场景 | 使用目标 | 典型用户 | 展示内容 | 实现效果 |
|---|---|---|---|---|
| 人物体态增强 | 提升胸腰臀比例、强化身体线条 | 影像后期师 / 模型博主 / AI 创作者 | 输入图与增强图并排或滑动对比 | 保持姿态一致的自然增强 |
| 角色美化 | 在不改变身份特征的前提下进行视觉升级 | 角色设计师 / Cos 模拟制作者 | 角色原图与优化后版本 | 风格统一的美化呈现 |
| 内容对比展示 | 制作前后差异说明图 | 教程作者 / 内容运营 | 体态调整前后可视化对比 | 变化明显、说明清晰 |
| 二创延展 | 在原图基础上进行体态再创作 | AI 插画创作者 | 原图结构与增强风格图 | 更突出的人物线条与视觉焦点 |
| 商业展示 | 输出高质量增强视觉用于宣传 | 品牌方 / 摄影工作室 | 前后对比、成品展示图 | 统一风格、高保真、可控强化 |
开发与应用
更多 AIGC 与 ComfyUI工作流 相关研究学习内容请查阅:
更多内容桌面应用开发和学习文档请查阅:
AIGC工具平台Tauri+Django环境开发,支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用