硅基流动上线百度 ERNIE-Image

图片模型更新了一波。ERNIE-Image-Turbo 是硅基流动上架的第 163 款模型,它快、稳、够好,适合海报、漫画、故事板及多画幅组合创作等大多数内容生产场景。

值得一提的是,这是百度 ERNIE-Image 团队自主通过硅基流动弹性 GPU 服务部署的模型。弹性 GPU 支持用户自主、高效部署任意模型及各类计算密集型服务的进阶需求。

百度 ERNIE-Image 团队负责人表示,"硅基流动弹性 GPU 服务提供了'开箱即用'的生产级模型部署体验。这让我们将模型部署为高可用推理服务端点的过程被极大简化,从资源准备到服务上线耗时大幅缩短,从而快速将 ERNIE-Image-Turbo 强大的图片生成能力分享给平台的千万用户。"

作为百度最新开源的 8B 文生图模型,它在不牺牲质量的前提下,把推理步数砍到 8 步。这意味着你可以快速验证不同提示词的视觉表现,尤其在需要快速原型验证、批量内容生成或交互式创作等应用场景,这种低延迟体验将直接转化为生产率的提升。

它继承了基础模型 ERNIE-Image 强大的指令跟随与文字渲染能力,使其像一位训练有素的速写大师,能捕捉提示词中的重点,将潦草的概念速写为充满美感的完整画面。它尤其擅长理解那些"麻烦"的需求:海报中复杂的文字排版、漫画分镜里严谨的角色关系、信息图表中精确的图文布局......都能可靠地遵循,并赋予出色的美学呈现。

(提示词:一张电影级写实照片,35mm胶片质感。场景:日落时分的城市天台(可见远处高楼剪影和淡紫色晚霞)。人物:一位年轻女性,穿卡其色风衣,右手端着相机,左手拿着一张刚打印出来的图片。她的表情是满意的微笑,目光看着相机镜头。环境细节:天台边有一把折叠椅,椅子靠背上搭着一件牛仔外套。地面上有几张散落的草稿纸,纸上用铅笔写着潦草的"prompt → image"。要求整体光影自然,字迹与文字内容清晰可读,人物动作自然不僵硬。)

(提示词:一张现代咖啡店的开业促销海报,风格干净高级,背景为柔和的暖色调。画面中央居中放置大号粗体标题"ONLY 8 MINUTES",下方小字"新鲜现磨,无需久等",字体飘逸灵动,有手写感。画面中一杯热咖啡冒着蒸汽,位于标题附近。左下角以极小字体附上新款咖啡的文字介绍:"8小时低温慢萃,让埃塞俄比亚耶加雪菲的柑橘酸与茉莉花香缓缓释放,像夏日傍晚沿着海岸线不紧不慢地走了8公里。"要求所有文字(包括大标题、小标题及左下角极小文字)渲染清晰无畸变、无粘连,整体构图保持高级且具有设计感,确保左下角文字不抢视觉重心。)

它的风格覆盖广泛,从写实摄影的电影感,到柔和的设计风视觉,都能驾驭。但它更大的魅力在于,将你天马行空的描述,快速固化为可用的视觉素材,让创意验证的过程变得无比轻松。

(提示词:一个三格漫画竖版故事板,背景为简约的家庭工作室场景(书桌、台灯、笔记本电脑)。主角是一位戴圆框眼镜的年轻女性(脸上有雀斑,扎低马尾,穿浅蓝色卫衣),配角是一只戴同款圆框小眼镜的橘猫(坐在桌上)。第一格:女性对着空白画板揉太阳穴,呈现苦恼表情,橘猫伸爪轻拍她的手背,对话框写"卡稿了?";第二格:女性手指轻点平板屏幕,头顶亮起灯泡图标,橘猫凑近屏幕,惊讶状,对话框写"只需要8步?";第三格:女性举起平板展示一幅完整的画(画中是一只冲浪的熊猫),面露满意微笑,橘猫在旁边翘尾巴,对话框写"稳!"。要求三个格子中女性的发型、卫衣颜色、眼镜款式保持完全一致;橘猫的毛色(橘色虎斑)、眼镜款式、体型大小保持一致;所有对话框内的文字清晰可读,背景元素在三个格子中保持连续性)

(提示词:Peach and water photography, light pink background, surreal still life photography, macro shot tropical fruits, translucent textures, rendered in zbrush style, anime aesthetic, fairy tale core, sparkling water droplets, specular reflection, gorgeous colors, 8k)

这份即时生成高质量图片的 ERNIE-Image-Turbo 已准备就绪,API 调用价格为 0.11 元/张。你可以将其集成到你的 AI 创作工具中,或者作为智能应用背后的视觉引擎。

硅基流动 AI 云致力于成为开发者首选的"Token 工厂",提供大模型云服务、弹性 GPU预留实例AI算力运营服务。大模型云服务提供多样、高速、稳定且经济的模型 API,已上架 DeepSeek、Qwen、GLM、Kimi、MiniMax 等百款热门模型,覆盖语言、图像、音频、视频、嵌入与重排序全任务场景。仅需一个密钥,即可灵活调用,助开发者加速构建生成式 AI 应用。新用户可获得 16 元/ 1 美元赠金体验平台所有模型。多款模型免费,让开发者实现"Token 自由"。

相关推荐
. . . . .1 小时前
Claude Code 插件市场开发及注意事项
人工智能·gitcode
三产1 小时前
Hermes 教程 04:多平台网关
人工智能
Zldaisy3d1 小时前
上交大特材所 l 同步辐射CT与机器学习驱动增材制造气雾化粉末表征及工艺优化
人工智能·机器学习·制造
2401_832298101 小时前
低成本算力革命,OpenClaw适配低配硬件,普及个人级智能体
人工智能
沪漂阿龙1 小时前
面试题:传统序列模型详解——RNN、LSTM、GRU 原理、区别、优缺点一文讲透
人工智能·rnn·深度学习·gru·lstm
灵机一物1 小时前
灵机一物AI原生电商小程序、PC端(已上线)-技术解析:原生实时交互 AI 模型 TML-Interaction-Small,如何颠覆传统大模型交互范式
人工智能·交互
qq_411262421 小时前
四博 AI 双目智能音箱方案:四路触控、姿态感应、震动反馈、语音克隆和专属知识库一次拉满
人工智能·智能音箱
连线Insight1 小时前
重新定义AI价值标尺,百度用“DAA”打开产业下一幕
人工智能·微信公众平台
qq_411262421 小时前
四博 AI 双目智能音箱方案:四路触控、震动马达、IMU 姿态识别、语音克隆与知识库接入
人工智能·microsoft·智能音箱