OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传

如果你刚刚打开 X 并且正好关注了 OpenAI 和山姆・奥特曼,那么你可能会看到这样的照片:

是的,确实有点辣眼睛。就连 OpenAI 官方号也忍不住吐槽(其实是刷热度):sam.

而在评论区,更是一片吐槽和调侃:

但不管怎么说,热度是有了。

实际上,山姆・奥特曼之所以发这样一张辣眼睛的图片,正是为 OpenAI 刚刚推出的全新 ChatGPT Images 造势。而且这也不是唯一一张基于奥特曼照片改的图。OpenAI 官方号还专门单独特地发了一张这样的:

而且以身入局的 OpenAI 大佬还不止他一个。OpenAI 首席研究官 Mark Chen 和 OpenAI 总裁 Greg Brockman 都贡献了自己的照片。比如下面即是其官方博客分享的修图对话记录:

上下滑动查看

新版 ChatGPT Images

ChatGPT Images 的新版本由 OpenAI 全新的旗舰图像生成模型驱动。该公司表示:「现在,无论你是从零开始创作还是编辑照片,都能得到你脑海中构想的画面。它能在进行精准编辑的同时保持细节完好,图像生成速度更是提升了 4 倍。」

其核心特性是:精准编辑,保留关键细节。

现在,当用户要求对上传的图片进行编辑时,模型能更可靠地遵循用户的意图。按 OpenAI 的说法是「细致入微到每一个小细节」,比如仅改变用户要求的部分,同时在输入、输出和后续编辑中保持光影、构图和人物外观等元素的一致性。

这能解锁很多潜在用例,比如更实用的照片编辑、更逼真的服装和发型试穿,还是保留原始图像精髓的风格滤镜和概念转换。

编辑功能

OpenAI 表示:该模型擅长各种类型的编辑,包括添加、删减、组合、融合和置换。

下面是一个从生成到各种编辑的示例。

创意转换

该模型还具备 transformation 功能,即可以改变和添加元素(如文本和布局)来实现想法,同时保留重要细节。OpenAI 表示,这些转换既适用于简单的概念,也适用于复杂的概念,并且可以通过新版 ChatGPT Images 功能中的预设风格和创意轻松尝试 ------ 无需手动编写提示词。

比如,你可以将一张日常照片转换成电影海报。

或制作一张戴珍珠耳环的奥特曼。

遵循指令

OpenAI 称:「与我们的初始版本相比,该模型能更可靠地遵循指令。这不仅实现了更精准的编辑,还能处理更复杂的原始构图,按预期保留元素之间的关系。」下面给出了一个对比示例:

文本渲染

该模型在文本渲染方面又迈进了一步,能够处理更密集、更小的文本。

其他质量改进

该模型还在其他维度上进行了改进,使得输出结果能更直接地投入使用,例如渲染许多小尺寸的人脸以及提升输出结果的自然程度。

全新的创作空间

另外,OpenAI 还在 ChatGPT 中推出了全新的「Images」(图片)功能,「旨在让图像生成体验更加令人愉悦 ------ 不仅能激发灵感,还能让创意探索变得毫不费力。」

用户可通过移动应用的侧边栏和 chatgpt.com 访问,让图像的探索和尝试变得更快、更简单。它包含了数十种预设滤镜和提示词以快速激发灵感,并会定期更新以反映新兴趋势。

可用性

全新的 Images 模型于今日起向所有 ChatGPT 用户推出,并通过 API 以 GPT Image 1.5 的形式提供。与 GPT Image 1 相比,GPT Image 1.5 的图像输入和输出价格降低了 20%,因此用户可以在预算不变的情况下生成和迭代更多图像。

ChatGPT 中全新的 Images 体验也于今日向大多数用户开放,商业版(Business)和企业版(Enterprise)的访问权限将在稍后推出。

OpenAI 表示:「我们相信,我们仍处于图像生成所能实现的可能性的开端。今天的更新是向前迈出的有意义的一步,未来还将有更多功能推出,从更细粒度的编辑到跨语言的更丰富、更详细的输出。」

结语

最后,我们也使用一个同样的提示词,简单测试对比了 ChatGPT Images 与谷歌的 Nano Banana Pro。

ChatGPT Images 的结果

Nano Banana Pro 的结果

看起来,至少在这个特定案例中,ChatGPT Images 的结果更加符合我们的指令。

综合来看,在这场 AI 生图之战中,OpenAI 此次发布的 ChatGPT Images 标志着竞争的维度正在变化:从单纯的「模型能力」转向了综合的「产品体验」。OpenAI 这一次甚至没有放出任何量化的基准测试结果!

同时,Sam Altman 亲自下场自黑虽然充满了硅谷式的幽默,但其背后的信号非常清晰:OpenAI 正在极力降低用户的心理门槛。通过推出独立的「Images」入口、预设风格滤镜以及极大幅度的降价,OpenAI 试图将图像生成从一种需要精心调试提示词的专业技能,变成一种像发推特一样简单的日常交互。

你看好 ChatGPT Images 吗?

参考链接

openai.com/index/new-c...

x.com/OpenAI/stat...

相关推荐
机器之心2 小时前
SIGGRAPH Asia 2025:摩尔线程赢图形顶会3DGS挑战赛大奖,自研LiteGS全面开源
人工智能·openai
_Stellar2 小时前
从输入到输出:大语言模型一次完整推理简单解析
人工智能·语言模型·自然语言处理
【建模先锋】2 小时前
特征提取+概率神经网络 PNN 的轴承信号故障诊断模型
人工智能·深度学习·神经网络·信号处理·故障诊断·概率神经网络·特征提取
轲轲012 小时前
Week02 深度学习基本原理
人工智能·深度学习
老蒋新思维2 小时前
创客匠人:认知即资产 ——AI 时代创始人 IP 知识变现的底层逻辑
网络·人工智能·网络协议·tcp/ip·重构·创始人ip·创客匠人
开放知识图谱2 小时前
论文浅尝 | 大语言模型在带超关系的知识图谱上的推理(ICLR2025)
人工智能·语言模型·自然语言处理·知识图谱
世岩清上2 小时前
世岩清上:“人工智能+”可以赋能哪些行业场景?
人工智能·百度
sumAll2 小时前
别再手动对齐矩形了!这个开源神器让 AI 帮你画架构图 (Next-AI-Draw-IO 体验)
前端·人工智能·next.js
Java后端的Ai之路2 小时前
【智能体搭建平台篇】-Dify部署方案介绍
人工智能·chatgpt·aigc·ai编程