第 7 篇：ComfyUI 电商工作流骨架

第 7 篇：ComfyUI 电商工作流骨架

- [1. 目标：把"电商修图"改造成"电商素材包流水线"](#1. 目标：把“电商修图”改造成“电商素材包流水线”)
- [2. 工作流总览：从白底图到"主图/场景/详情页素材包"的四阶段](#2. 工作流总览：从白底图到“主图/场景/详情页素材包”的四阶段)
- - [2.1 骨架数据流](#2.1 骨架数据流)
  - [2.2 四个阶段对应的 ComfyUI Group](#2.2 四个阶段对应的 ComfyUI Group)
- [3. 输入规范：你要把"图片"当作"数据结构"](#3. 输入规范：你要把“图片”当作“数据结构”)
- - [3.1 输入文件约定（建议）](#3.1 输入文件约定（建议）)
  - [3.2 `product.json` 最小字段（用于 RAG/Agent 编排）](#3.2 product.json 最小字段（用于 RAG/Agent 编排）)
- [4. 处理阶段拆解：把"节点堆叠"变成"可维护模块"](#4. 处理阶段拆解：把“节点堆叠”变成“可维护模块”)
- - [4.1 G0：输入校验（硬门槛）](#4.1 G0：输入校验（硬门槛）)
  - [4.2 G1：主体分离（两种路径）](#4.2 G1：主体分离（两种路径）)
  - [4.3 G2：三分支生成（主图 / 场景 / 详情图块）](#4.3 G2：三分支生成（主图 / 场景 / 详情图块）)
  - - [分支 1：主图（影棚风 / 白底 / 渐变）](#分支 1：主图（影棚风 / 白底 / 渐变）)
    - [分支 2：场景图（背景替换 + 风格迁移）](#分支 2：场景图（背景替换 + 风格迁移）)
    - [分支 3：详情页素材图块（Detail Tiles）](#分支 3：详情页素材图块（Detail Tiles）)
- [5. 输出规格：统一"母版"，再做多渠道派生](#5. 输出规格：统一“母版”，再做多渠道派生)
- - [5.1 母版（Master）策略](#5.1 母版（Master）策略)
  - [5.2 渠道裁切策略（只讲"比例与安全区"，不锁死像素）](#5.2 渠道裁切策略（只讲“比例与安全区”，不锁死像素）)
  - [5.3 输出"素材包"目录结构](#5.3 输出“素材包”目录结构)
- [6. 参数建议](#6. 参数建议)
- [7. 与 RAG/Agent 的对接点：让"出图"变成"可运营资产"](#7. 与 RAG/Agent 的对接点：让“出图”变成“可运营资产”)
- [8. V1 上线前的质量门禁](#8. V1 上线前的质量门禁)

在电商场景里，ComfyUI 不是"做几张好看的图"，而是一个可批处理、可复现、可交付 的"素材工厂"。这一篇我们把骨架搭出来：从白底图出发，一次跑通主图/场景图/详情页素材包，并把输入规范、输出规格、渠道裁切策略固化成"工程契约"。

你后续无论换模型（Flux、SD、各种 LoRA/Control）还是换云 GPU，只要骨架不变，交付就稳定。

1. 目标：把"电商修图"改造成"电商素材包流水线"

一条合格的电商内容流水线，至少要同时满足三件事：

风格一致：一套商品图跑出来的主图、场景图、详情图不跳戏
规格合规：不同渠道（淘宝/咸鱼/小红书/Shopify/TikTok/YouTube）尺寸、比例、裁切都可控
可批处理：输入一批 SKU，输出一批素材包，命名、结构、元数据全统一

ComfyUI.org 给出的电商图像增强工作流，核心包含：风格迁移（style transfer）+ 智能修补（inpainting）+ 文案/描述生成（captioning） ，并明确了输入与输出规格的关键约束（PNG/alpha、更高分辨率、mask、提示词结构等）。(ComfyUI)

2. 工作流总览：从白底图到"主图/场景/详情页素材包"的四阶段

2.1 骨架数据流

白底图/透明底 PNG
主体分离/抠图
主图标准化

清洁+锐化+颜色校正
主图生成/增强

白底/渐变/影棚
场景图生成

背景替换+风格迁移
详情图素材

细节特写+参数图块
多渠道裁切/导出
素材包打包

目录+命名+meta.json

2.2 四个阶段对应的 ComfyUI Group

G0 输入与校验：LoadImage、尺寸校验、色彩空间、alpha 检测
G1 主体分离：透明底优先；否则背景分离（mask）
G2 三分支生成：主图 / 场景 / 详情页图块
G3 渠道裁切与导出：一张"母版"派生多比例、多尺寸、多渠道

3. 输入规范：你要把"图片"当作"数据结构"

ComfyUI.org 的电商工作流对输入提出了非常工程化的要求：PNG（优先带 alpha），分辨率建议至少 1024×1024；mask 为黑白图（白色表示需要修补/重绘区域）；提示词必须包含品类与风格关键词 。(ComfyUI)

3.1 输入文件约定（建议）

每个 SKU 一个目录：

复制代码

SKU_0001/
  input/
    hero.png                 # 主图，优先透明底 PNG
    detail_01.png
    detail_02.png
    lifestyle_ref.jpg        # 可选：风格/场景参考
    mask_hero.png            # 可选：需要重绘/修补区域
  meta/
    product.json             # 标题/卖点/参数/禁词

3.2 `product.json` 最小字段（用于 RAG/Agent 编排）

json 复制代码

{
  "sku": "SKU_0001",
  "title": "......",
  "category": "......",
  "benefits": ["卖点1", "卖点2", "卖点3"],
  "specs": ["参数1", "参数2"],
  "brand_tone": "高端/简约/科技感",
  "forbidden": ["医疗功效", "绝对化用语"]
}

4. 处理阶段拆解：把"节点堆叠"变成"可维护模块"

下面按最常见的"白底→场景迁移"路线讲骨架。ComfyUI.org 提到的关键能力点包括：风格迁移、inpainting 修补、图像理解与自动 caption ；示例工作流中也列了 Florence-2 用于图像理解、JoyCaption/Llama 用于描述生成、以及风格模型与 Flux inpaint 等组合。(ComfyUI)

4.1 G0：输入校验（硬门槛）

校验：是否 PNG + alpha；若无 alpha，则必须走背景分离（输出 mask）
校验：最短边 < 1024 的直接拒绝（避免后续修补崩坏）(ComfyUI)
统一色彩空间：sRGB（减少导出后渠道色偏争议）

4.2 G1：主体分离（两种路径）

路径 A：透明底 PNG （首选）
直接进入后续分支，mask 只用于"局部修补"
路径 B：白底图
需要生成主体 mask，再做背景替换。ComfyUI 的电商"迁移/换背景"类工作流一般都明确要求"产品图 + 背景图 + 手工/半自动 mask"，并强调 mask 边缘覆盖要足够，否则会出现边缘伪影。(ComfyUI)

工程建议：V1 不追求全自动抠图，把"可控、稳定"放在第一位；用半自动 mask 也能把批量出图效率提高一个数量级。

4.3 G2：三分支生成（主图 / 场景 / 详情图块）

分支 1：主图（影棚风 / 白底 / 渐变）

目标：输出平台主图"干净、真实、可放大看细节"。

常用手段：

轻度锐化、去噪、提升微对比
生成"自然投影/接触阴影"而不是硬贴图（看起来更真实）

分支 2：场景图（背景替换 + 风格迁移）

目标：把白底商品迁移到"可解释的真实场景"，但保持商品形态不变。

ComfyUI.org 的"背景替换/迁移"类工作流描述了典型结构：加载产品与背景、统一尺寸、caption 生成提示词、Redux/控制节点限定重绘区域、KSampler 完成 inpaint，最后合成与裁切导出。(ComfyUI)

关键控制点（强烈建议写进你的模板参数）：

Keep Product Identity：商品主体不允许被"重画成另一个东西"
背景只负责叙事：不要让背景元素压过商品
边缘治理：mask 边缘加宽 2--6px（视分辨率），减少光晕

分支 3：详情页素材图块（Detail Tiles）

目标：输出详情页可直接拼版的"图块资产"，例如：

细节特写（纹理、接口、材质）
参数对比块（简洁信息层）
使用场景块（解决哪个痛点）

ComfyUI 的电商增强工作流本身会输出"HD 图片 + 多风格变体 + 文本描述（JSON/text）"，你可以把 caption 直接作为详情页文案的起点。(ComfyUI)

5. 输出规格：统一"母版"，再做多渠道派生

5.1 母版（Master）策略

一个可交付的做法是：每张图先产出一张"母版"，再由母版派生不同渠道裁切与尺寸。

母版推荐：4:5 或 3:4（竖向更适配小红书/TikTok，同时也方便裁切成 1:1、16:9）
输出格式：PNG（保真/可二次编辑）+ JPG（发布/体积更小）
输出内容：主图/场景/详情图块各自至少 2--4 张 variant（用于 A/B）

ComfyUI.org 的电商流程在 I/O 里明确"输出为 HD PNG，多风格变体，并产出文本描述"。(ComfyUI)

5.2 渠道裁切策略（只讲"比例与安全区"，不锁死像素）

你需要的是"裁切策略"，不是"死记尺寸"。建议按渠道先定比例：

淘宝/咸鱼主图：优先 1:1；可加 4:5 作为补充
小红书：3:4（主流）
TikTok：9:16
YouTube：16:9（封面与横版素材）

统一裁切公式（中心裁切，保持主体）

工程化落地建议：

主体 bbox（由 mask 得到）必须落在"安全区"内（例如距边缘至少 6% 边距）
所有裁切输出都写入 meta.json（记录裁切框坐标与比例），便于复现与回滚

5.3 输出"素材包"目录结构

复制代码

SKU_0001/output/
  master/
    hero_master_4x5.png
    scene_01_master_4x5.png
    detail_tile_01_master_1x1.png
  channels/
    taobao/
      hero_1x1.jpg
      scene_1x1.jpg
    xhs/
      hero_3x4.jpg
      scene_3x4.jpg
    tiktok/
      scene_9x16.jpg
    youtube/
      scene_16x9.jpg
  copy/
    captions.json
    title_variants.txt
    bullet_points.txt
  meta.json

6. 参数建议

ComfyUI.org 的背景迁移工作流示例里，明确给出了"统一分辨率（例如 1200×1600）"、采样器与步数、CFG 等参数，并强调 VRAM 与 --medvram 等运行建议。(ComfyUI)

V1 建议你把参数固定为"可解释、可复现"的配置文件（例如 preset_ecom_v1.yaml），核心就三类：

分辨率：母版统一（例如 1200×1600 或 1024×1536）(ComfyUI)
风格融合：Style blend（0.3--0.7 区间常见）(ComfyUI)
采样：步数/CFG 不追求极致，追求稳定与速度（批量可控）

7. 与 RAG/Agent 的对接点：让"出图"变成"可运营资产"

你真正要卖的不是"图片"，而是"可持续运营的内容资产"。最关键的两个对接点：

输入侧 ：RAG 把商品卖点、禁词、平台规则写入 product.json，Agent 选择模板与风格
输出侧 ：把 captions.json + meta.json 入库，后续用于：
- 自动生成详情页文案与 FAQ
- 自动生成短视频脚本（把场景图串成镜头）
- A/B 测试归因（哪个 variant 转化更高）

ComfyUI.org 的流程里提到自动 caption（Florence-2 + JoyCaption/Llama）可以产出产品描述文本，你直接把这部分当作"运营素材的结构化底座"。(ComfyUI)

8. V1 上线前的质量门禁

主体一致性：商品结构不被重画（特别是 logo/文字/接口位置）
边缘质量：无光晕、无锯齿、无背景穿透（mask 边缘治理）(ComfyUI)
风格一致性：同一 SKU 的场景图色调/光向一致
渠道合规：裁切后主体不被切断，安全区满足
可复现：所有输出都能用 meta.json + preset 复跑

第 7 篇：ComfyUI 电商工作流骨架

第 7 篇：ComfyUI 电商工作流骨架

1. 目标：把"电商修图"改造成"电商素材包流水线"

2. 工作流总览：从白底图到"主图/场景/详情页素材包"的四阶段

2.1 骨架数据流

2.2 四个阶段对应的 ComfyUI Group

3. 输入规范：你要把"图片"当作"数据结构"

3.1 输入文件约定（建议）

3.2 product.json 最小字段（用于 RAG/Agent 编排）

4. 处理阶段拆解：把"节点堆叠"变成"可维护模块"

4.1 G0：输入校验（硬门槛）

4.2 G1：主体分离（两种路径）

4.3 G2：三分支生成（主图 / 场景 / 详情图块）

分支 1：主图（影棚风 / 白底 / 渐变）

分支 2：场景图（背景替换 + 风格迁移）

分支 3：详情页素材图块（Detail Tiles）

5. 输出规格：统一"母版"，再做多渠道派生

5.1 母版（Master）策略

5.2 渠道裁切策略（只讲"比例与安全区"，不锁死像素）

5.3 输出"素材包"目录结构

6. 参数建议

7. 与 RAG/Agent 的对接点：让"出图"变成"可运营资产"

8. V1 上线前的质量门禁

3.2 `product.json` 最小字段（用于 RAG/Agent 编排）