OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传

如果你刚刚打开 X 并且正好关注了 OpenAI 和山姆・奥特曼,那么你可能会看到这样的照片:

是的,确实有点辣眼睛。就连 OpenAI 官方号也忍不住吐槽(其实是刷热度):sam.

而在评论区,更是一片吐槽和调侃:

但不管怎么说,热度是有了。

实际上,山姆・奥特曼之所以发这样一张辣眼睛的图片,正是为 OpenAI 刚刚推出的全新 ChatGPT Images 造势。而且这也不是唯一一张基于奥特曼照片改的图。OpenAI 官方号还专门单独特地发了一张这样的:

而且以身入局的 OpenAI 大佬还不止他一个。OpenAI 首席研究官 Mark Chen 和 OpenAI 总裁 Greg Brockman 都贡献了自己的照片。比如下面即是其官方博客分享的修图对话记录:

上下滑动查看

新版 ChatGPT Images

ChatGPT Images 的新版本由 OpenAI 全新的旗舰图像生成模型驱动。该公司表示:「现在,无论你是从零开始创作还是编辑照片,都能得到你脑海中构想的画面。它能在进行精准编辑的同时保持细节完好,图像生成速度更是提升了 4 倍。」

其核心特性是:精准编辑,保留关键细节。

现在,当用户要求对上传的图片进行编辑时,模型能更可靠地遵循用户的意图。按 OpenAI 的说法是「细致入微到每一个小细节」,比如仅改变用户要求的部分,同时在输入、输出和后续编辑中保持光影、构图和人物外观等元素的一致性。

这能解锁很多潜在用例,比如更实用的照片编辑、更逼真的服装和发型试穿,还是保留原始图像精髓的风格滤镜和概念转换。

编辑功能

OpenAI 表示:该模型擅长各种类型的编辑,包括添加、删减、组合、融合和置换。

下面是一个从生成到各种编辑的示例。

创意转换

该模型还具备 transformation 功能,即可以改变和添加元素(如文本和布局)来实现想法,同时保留重要细节。OpenAI 表示,这些转换既适用于简单的概念,也适用于复杂的概念,并且可以通过新版 ChatGPT Images 功能中的预设风格和创意轻松尝试 ------ 无需手动编写提示词。

比如,你可以将一张日常照片转换成电影海报。

或制作一张戴珍珠耳环的奥特曼。

遵循指令

OpenAI 称:「与我们的初始版本相比,该模型能更可靠地遵循指令。这不仅实现了更精准的编辑,还能处理更复杂的原始构图,按预期保留元素之间的关系。」下面给出了一个对比示例:

文本渲染

该模型在文本渲染方面又迈进了一步,能够处理更密集、更小的文本。

其他质量改进

该模型还在其他维度上进行了改进,使得输出结果能更直接地投入使用,例如渲染许多小尺寸的人脸以及提升输出结果的自然程度。

全新的创作空间

另外,OpenAI 还在 ChatGPT 中推出了全新的「Images」(图片)功能,「旨在让图像生成体验更加令人愉悦 ------ 不仅能激发灵感,还能让创意探索变得毫不费力。」

用户可通过移动应用的侧边栏和 chatgpt.com 访问,让图像的探索和尝试变得更快、更简单。它包含了数十种预设滤镜和提示词以快速激发灵感,并会定期更新以反映新兴趋势。

可用性

全新的 Images 模型于今日起向所有 ChatGPT 用户推出,并通过 API 以 GPT Image 1.5 的形式提供。与 GPT Image 1 相比,GPT Image 1.5 的图像输入和输出价格降低了 20%,因此用户可以在预算不变的情况下生成和迭代更多图像。

ChatGPT 中全新的 Images 体验也于今日向大多数用户开放,商业版(Business)和企业版(Enterprise)的访问权限将在稍后推出。

OpenAI 表示:「我们相信,我们仍处于图像生成所能实现的可能性的开端。今天的更新是向前迈出的有意义的一步,未来还将有更多功能推出,从更细粒度的编辑到跨语言的更丰富、更详细的输出。」

结语

最后,我们也使用一个同样的提示词,简单测试对比了 ChatGPT Images 与谷歌的 Nano Banana Pro。

ChatGPT Images 的结果

Nano Banana Pro 的结果

看起来,至少在这个特定案例中,ChatGPT Images 的结果更加符合我们的指令。

综合来看,在这场 AI 生图之战中,OpenAI 此次发布的 ChatGPT Images 标志着竞争的维度正在变化:从单纯的「模型能力」转向了综合的「产品体验」。OpenAI 这一次甚至没有放出任何量化的基准测试结果!

同时,Sam Altman 亲自下场自黑虽然充满了硅谷式的幽默,但其背后的信号非常清晰:OpenAI 正在极力降低用户的心理门槛。通过推出独立的「Images」入口、预设风格滤镜以及极大幅度的降价,OpenAI 试图将图像生成从一种需要精心调试提示词的专业技能,变成一种像发推特一样简单的日常交互。

你看好 ChatGPT Images 吗?

参考链接

openai.com/index/new-c...

x.com/OpenAI/stat...

相关推荐
小陈工1 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
墨染天姬6 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志6 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114246 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠6 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光6 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好6 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
智星云算力7 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南
人工智能·架构·gpu算力·智星云·gpu租用
jinanwuhuaguo7 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁
android·开发语言·人工智能·深度学习·kotlin
xiaozhazha_7 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现
人工智能