百度也正式加入开源社区,发布了 ERNIE-Image 模型,直接对标 ZImage 和 Klein

一、百度开源ERNIE-Image

开源背景: 由百度ERNIE-Image团队开发的开源文本生成图像模型

参数规模: 仅8B参数,在开源权重模型中达到SOTA性能

应用场景: 商业海报、漫画、多面板布局等需要精确控制的内容创作

1. 文心Image Turbo版

对标模型: 与ZImage和FluxKlein对比,参数更精简(8B vsKlein的9B/4B)

生成特点: 偏向真实感和细节表现

版本区别:

标准版:建议步数50,CFG值4

Turbo版:步数8,CFG值1

使用建议: 可根据需求效果选择不同版本

1)使用方法

基础设置:

需输入图片宽度和高度(有建议尺寸)

支持提示词助手功能,可自动优化提示词

建议尺寸: 1024x1024、848x1264、1264x848等特定比例

生成控制: 支持随机种子、步数、采样器等参数调节

2)安装方法

一键安装:

通过ComfyUI管理大师在工作流广场直接安装

自动下载工作流文件及所有依赖

安装完成后重启即可使用

手动安装:

从ComfyUI搅拌站下载模型和工作流文件

覆盖models文件夹并安装所需插件

拖入工作流文件即可运行

2. 文心Image标准版

主要区别:

使用不同的基础模型

采样设置不同(步数50 vs Turbo版的8)

CFG值固定为4

安装方式: 与Turbo版相同

可通过comfyui管理大师一键安装

3. 模型特点总结

核心优势:

复杂指令跟随能力强

文字渲染效果出色

结构化图像生成精准

风格支持:

写实摄影

设计导向图像

多种风格化美学输出

控制能力: 在视觉效果和内容精确实现间取得平衡

二、知识小结

|----------------|-----------------------------------|------------------|-------------|-------------------------------------------|
| 型号 | 功能亮点 | 技术参数 | 适用场景 | 竞品对比 |
| 文心Image标准版 | 偏重真实感和细节生成,支持自定义提示词优化 | 采样步数50步,CFG值4 | 需要高精细度图像的场景 | 对标Stable Diffusion和DALL·E,参数规模更小(8B)但效果接近 |
| 文心Image Turbo版 | 生成速度优化,保留核心图像质量 | 采样步数8步,CFG值1 | 快速出图需求场景 | 相比标准版速度提升明显,但细节略逊于标准版 |
| 安装方法 | 一键安装(通过ComfyUI管理大师)或手动安装(下载模型+插件) | 依赖自动配置,支持工作流直接运行 | ComfyUI平台用户 | 比手动安装同类模型工作流效率更高 |
| 提示词助手 | 自动丰富和优化提示词,提升生成效果 | 需手动开启开关 | 新手或需灵感辅助的用户 | 类似MidJourney的describe功能,但集成在工具内 |

ComfyUI管理大师(最好用的ComfyUI管理器):

https://comfyit.cn/blog/250/?invite_code=TSH

相关推荐
冬奇Lab13 小时前
Workflow 系列(03):状态管理——持久化、幂等性与版本绑定
人工智能·工作流引擎
冬奇Lab13 小时前
每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot
人工智能·开源·自动驾驶
吴佳浩15 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒15 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海15 小时前
AI额度不够用的解决方案
人工智能
后端小肥肠15 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao15 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理
程序员cxuan17 小时前
一句话,让你用上 GPT-5.6
人工智能·后端·程序员
机器之心17 小时前
AI圈刚开始谈Loop Engineering,两位95后博士已经盯上了人类闭环数据
人工智能·openai