百度也正式加入开源社区，发布了 ERNIE-Image 模型，直接对标 ZImage 和 Klein

一、百度开源ERNIE-Image

开源背景: 由百度ERNIE-Image团队开发的开源文本生成图像模型

参数规模: 仅8B参数，在开源权重模型中达到SOTA性能

应用场景: 商业海报、漫画、多面板布局等需要精确控制的内容创作

1. 文心Image Turbo版

对标模型: 与ZImage和FluxKlein对比，参数更精简(8B vsKlein的9B/4B)

生成特点: 偏向真实感和细节表现

版本区别:

标准版：建议步数50，CFG值4

Turbo版：步数8，CFG值1

使用建议: 可根据需求效果选择不同版本

1）使用方法

基础设置:

需输入图片宽度和高度(有建议尺寸)

支持提示词助手功能，可自动优化提示词

建议尺寸: 1024x1024、848x1264、1264x848等特定比例

生成控制: 支持随机种子、步数、采样器等参数调节

2）安装方法

一键安装:

通过ComfyUI管理大师在工作流广场直接安装

自动下载工作流文件及所有依赖

安装完成后重启即可使用

手动安装:

从ComfyUI搅拌站下载模型和工作流文件

覆盖models文件夹并安装所需插件

拖入工作流文件即可运行

2. 文心Image标准版

主要区别:

使用不同的基础模型

采样设置不同(步数50 vs Turbo版的8)

CFG值固定为4

安装方式: 与Turbo版相同

可通过comfyui管理大师一键安装

3. 模型特点总结

核心优势:

复杂指令跟随能力强

文字渲染效果出色

结构化图像生成精准

风格支持:

写实摄影

设计导向图像

多种风格化美学输出

控制能力: 在视觉效果和内容精确实现间取得平衡

二、知识小结

|----------------|-----------------------------------|------------------|-------------|-------------------------------------------|
| 型号 | 功能亮点 | 技术参数 | 适用场景 | 竞品对比 |
| 文心Image标准版 | 偏重真实感和细节生成，支持自定义提示词优化 | 采样步数50步，CFG值4 | 需要高精细度图像的场景 | 对标Stable Diffusion和DALL·E，参数规模更小（8B）但效果接近 |
| 文心Image Turbo版 | 生成速度优化，保留核心图像质量 | 采样步数8步，CFG值1 | 快速出图需求场景 | 相比标准版速度提升明显，但细节略逊于标准版 |
| 安装方法 | 一键安装（通过ComfyUI管理大师）或手动安装（下载模型+插件） | 依赖自动配置，支持工作流直接运行 | ComfyUI平台用户 | 比手动安装同类模型工作流效率更高 |
| 提示词助手 | 自动丰富和优化提示词，提升生成效果 | 需手动开启开关 | 新手或需灵感辅助的用户 | 类似MidJourney的describe功能，但集成在工具内 |

ComfyUI管理大师（最好用的ComfyUI管理器）：

https://comfyit.cn/blog/250/?invite_code=TSH