一、百度开源ERNIE-Image


开源背景: 由百度ERNIE-Image团队开发的开源文本生成图像模型
参数规模: 仅8B参数,在开源权重模型中达到SOTA性能
应用场景: 商业海报、漫画、多面板布局等需要精确控制的内容创作
1. 文心Image Turbo版
对标模型: 与ZImage和FluxKlein对比,参数更精简(8B vsKlein的9B/4B)
生成特点: 偏向真实感和细节表现

版本区别:
标准版:建议步数50,CFG值4
Turbo版:步数8,CFG值1
使用建议: 可根据需求效果选择不同版本
1)使用方法
基础设置:
需输入图片宽度和高度(有建议尺寸)

支持提示词助手功能,可自动优化提示词


建议尺寸: 1024x1024、848x1264、1264x848等特定比例
生成控制: 支持随机种子、步数、采样器等参数调节
2)安装方法
一键安装:


通过ComfyUI管理大师在工作流广场直接安装
自动下载工作流文件及所有依赖
安装完成后重启即可使用
手动安装:



从ComfyUI搅拌站下载模型和工作流文件
覆盖models文件夹并安装所需插件
拖入工作流文件即可运行
2. 文心Image标准版
主要区别:
使用不同的基础模型
采样设置不同(步数50 vs Turbo版的8)
CFG值固定为4
安装方式: 与Turbo版相同
可通过comfyui管理大师一键安装


3. 模型特点总结
核心优势:
复杂指令跟随能力强
文字渲染效果出色
结构化图像生成精准
风格支持:
写实摄影
设计导向图像
多种风格化美学输出
控制能力: 在视觉效果和内容精确实现间取得平衡
二、知识小结
|----------------|-----------------------------------|------------------|-------------|-------------------------------------------|
| 型号 | 功能亮点 | 技术参数 | 适用场景 | 竞品对比 |
| 文心Image标准版 | 偏重真实感和细节生成,支持自定义提示词优化 | 采样步数50步,CFG值4 | 需要高精细度图像的场景 | 对标Stable Diffusion和DALL·E,参数规模更小(8B)但效果接近 |
| 文心Image Turbo版 | 生成速度优化,保留核心图像质量 | 采样步数8步,CFG值1 | 快速出图需求场景 | 相比标准版速度提升明显,但细节略逊于标准版 |
| 安装方法 | 一键安装(通过ComfyUI管理大师)或手动安装(下载模型+插件) | 依赖自动配置,支持工作流直接运行 | ComfyUI平台用户 | 比手动安装同类模型工作流效率更高 |
| 提示词助手 | 自动丰富和优化提示词,提升生成效果 | 需手动开启开关 | 新手或需灵感辅助的用户 | 类似MidJourney的describe功能,但集成在工具内 |
ComfyUI管理大师(最好用的ComfyUI管理器):