硅基流动上线百度 ERNIE-Image

图片模型更新了一波。ERNIE-Image-Turbo 是硅基流动上架的第 163 款模型,它快、稳、够好,适合海报、漫画、故事板及多画幅组合创作等大多数内容生产场景。

值得一提的是,这是百度 ERNIE-Image 团队自主通过硅基流动弹性 GPU 服务部署的模型。弹性 GPU 支持用户自主、高效部署任意模型及各类计算密集型服务的进阶需求。

百度 ERNIE-Image 团队负责人表示,"硅基流动弹性 GPU 服务提供了'开箱即用'的生产级模型部署体验。这让我们将模型部署为高可用推理服务端点的过程被极大简化,从资源准备到服务上线耗时大幅缩短,从而快速将 ERNIE-Image-Turbo 强大的图片生成能力分享给平台的千万用户。"

作为百度最新开源的 8B 文生图模型,它在不牺牲质量的前提下,把推理步数砍到 8 步。这意味着你可以快速验证不同提示词的视觉表现,尤其在需要快速原型验证、批量内容生成或交互式创作等应用场景,这种低延迟体验将直接转化为生产率的提升。

它继承了基础模型 ERNIE-Image 强大的指令跟随与文字渲染能力,使其像一位训练有素的速写大师,能捕捉提示词中的重点,将潦草的概念速写为充满美感的完整画面。它尤其擅长理解那些"麻烦"的需求:海报中复杂的文字排版、漫画分镜里严谨的角色关系、信息图表中精确的图文布局......都能可靠地遵循,并赋予出色的美学呈现。

(提示词:一张电影级写实照片,35mm胶片质感。场景:日落时分的城市天台(可见远处高楼剪影和淡紫色晚霞)。人物:一位年轻女性,穿卡其色风衣,右手端着相机,左手拿着一张刚打印出来的图片。她的表情是满意的微笑,目光看着相机镜头。环境细节:天台边有一把折叠椅,椅子靠背上搭着一件牛仔外套。地面上有几张散落的草稿纸,纸上用铅笔写着潦草的"prompt → image"。要求整体光影自然,字迹与文字内容清晰可读,人物动作自然不僵硬。)

(提示词:一张现代咖啡店的开业促销海报,风格干净高级,背景为柔和的暖色调。画面中央居中放置大号粗体标题"ONLY 8 MINUTES",下方小字"新鲜现磨,无需久等",字体飘逸灵动,有手写感。画面中一杯热咖啡冒着蒸汽,位于标题附近。左下角以极小字体附上新款咖啡的文字介绍:"8小时低温慢萃,让埃塞俄比亚耶加雪菲的柑橘酸与茉莉花香缓缓释放,像夏日傍晚沿着海岸线不紧不慢地走了8公里。"要求所有文字(包括大标题、小标题及左下角极小文字)渲染清晰无畸变、无粘连,整体构图保持高级且具有设计感,确保左下角文字不抢视觉重心。)

它的风格覆盖广泛,从写实摄影的电影感,到柔和的设计风视觉,都能驾驭。但它更大的魅力在于,将你天马行空的描述,快速固化为可用的视觉素材,让创意验证的过程变得无比轻松。

(提示词:一个三格漫画竖版故事板,背景为简约的家庭工作室场景(书桌、台灯、笔记本电脑)。主角是一位戴圆框眼镜的年轻女性(脸上有雀斑,扎低马尾,穿浅蓝色卫衣),配角是一只戴同款圆框小眼镜的橘猫(坐在桌上)。第一格:女性对着空白画板揉太阳穴,呈现苦恼表情,橘猫伸爪轻拍她的手背,对话框写"卡稿了?";第二格:女性手指轻点平板屏幕,头顶亮起灯泡图标,橘猫凑近屏幕,惊讶状,对话框写"只需要8步?";第三格:女性举起平板展示一幅完整的画(画中是一只冲浪的熊猫),面露满意微笑,橘猫在旁边翘尾巴,对话框写"稳!"。要求三个格子中女性的发型、卫衣颜色、眼镜款式保持完全一致;橘猫的毛色(橘色虎斑)、眼镜款式、体型大小保持一致;所有对话框内的文字清晰可读,背景元素在三个格子中保持连续性)

(提示词:Peach and water photography, light pink background, surreal still life photography, macro shot tropical fruits, translucent textures, rendered in zbrush style, anime aesthetic, fairy tale core, sparkling water droplets, specular reflection, gorgeous colors, 8k)

这份即时生成高质量图片的 ERNIE-Image-Turbo 已准备就绪,API 调用价格为 0.11 元/张。你可以将其集成到你的 AI 创作工具中,或者作为智能应用背后的视觉引擎。

硅基流动 AI 云致力于成为开发者首选的"Token 工厂",提供大模型云服务、弹性 GPU预留实例AI算力运营服务。大模型云服务提供多样、高速、稳定且经济的模型 API,已上架 DeepSeek、Qwen、GLM、Kimi、MiniMax 等百款热门模型,覆盖语言、图像、音频、视频、嵌入与重排序全任务场景。仅需一个密钥,即可灵活调用,助开发者加速构建生成式 AI 应用。新用户可获得 16 元/ 1 美元赠金体验平台所有模型。多款模型免费,让开发者实现"Token 自由"。

相关推荐
zhangfeng1133几秒前
DNN Transformer SNN 这几个模型的对比和应用场景 前景
人工智能·transformer·dnn
V搜xhliang02463 分钟前
告别SPSS卡顿:用AI智能体自动跑回归、生存曲线、生成方法学段落
运维·人工智能·数据挖掘·回归·机器人·自动化·飞书
Triv20254 分钟前
边缘计算新选择:Kvaser Edge 搭载容器化 OS,四路隔离 CAN-FD + Wi-Fi 6 + GNSS/IMU 全解析
人工智能·边缘计算·远程管理·socketcan·linux容器·ip67、gnss、imu·can-fd
nix.gnehc4 分钟前
CLI 入门:从终端命令到 AI Agent 调用
人工智能·cli
大象说5 分钟前
朱雀大模型检测对降AI改写内容的适配性实测与原理拆解
人工智能
kisdiem8 分钟前
GAN(Generative Adversarial Network)生成对抗网络
人工智能·神经网络·生成对抗网络
咖啡星人k9 分钟前
AI友好的全栈架构设计:接口规范、状态管理与组件拆分的最佳实践
人工智能
财迅通Ai18 分钟前
智迪科技斥资1.52亿元收购越南工厂:当“租赁出海”走向“资产出海”
人工智能·科技·智迪科技
RD_daoyi22 分钟前
Google SEO第三周:网站站内基础优化——决定排名快慢的核心基建
大数据·人工智能·学习·搜索引擎·百度·googlecloud
zhangfeng113325 分钟前
超算中心 高性能计算 slurm的linux版本 centos7,如何安装docker,如何安装torch2.4
linux·运维·服务器·开发语言·人工智能·机器学习·docker