OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传

如果你刚刚打开 X 并且正好关注了 OpenAI 和山姆・奥特曼,那么你可能会看到这样的照片:

是的,确实有点辣眼睛。就连 OpenAI 官方号也忍不住吐槽(其实是刷热度):sam.

而在评论区,更是一片吐槽和调侃:

但不管怎么说,热度是有了。

实际上,山姆・奥特曼之所以发这样一张辣眼睛的图片,正是为 OpenAI 刚刚推出的全新 ChatGPT Images 造势。而且这也不是唯一一张基于奥特曼照片改的图。OpenAI 官方号还专门单独特地发了一张这样的:

而且以身入局的 OpenAI 大佬还不止他一个。OpenAI 首席研究官 Mark Chen 和 OpenAI 总裁 Greg Brockman 都贡献了自己的照片。比如下面即是其官方博客分享的修图对话记录:

上下滑动查看

新版 ChatGPT Images

ChatGPT Images 的新版本由 OpenAI 全新的旗舰图像生成模型驱动。该公司表示:「现在,无论你是从零开始创作还是编辑照片,都能得到你脑海中构想的画面。它能在进行精准编辑的同时保持细节完好,图像生成速度更是提升了 4 倍。」

其核心特性是:精准编辑,保留关键细节。

现在,当用户要求对上传的图片进行编辑时,模型能更可靠地遵循用户的意图。按 OpenAI 的说法是「细致入微到每一个小细节」,比如仅改变用户要求的部分,同时在输入、输出和后续编辑中保持光影、构图和人物外观等元素的一致性。

这能解锁很多潜在用例,比如更实用的照片编辑、更逼真的服装和发型试穿,还是保留原始图像精髓的风格滤镜和概念转换。

编辑功能

OpenAI 表示:该模型擅长各种类型的编辑,包括添加、删减、组合、融合和置换。

下面是一个从生成到各种编辑的示例。

创意转换

该模型还具备 transformation 功能,即可以改变和添加元素(如文本和布局)来实现想法,同时保留重要细节。OpenAI 表示,这些转换既适用于简单的概念,也适用于复杂的概念,并且可以通过新版 ChatGPT Images 功能中的预设风格和创意轻松尝试 ------ 无需手动编写提示词。

比如,你可以将一张日常照片转换成电影海报。

或制作一张戴珍珠耳环的奥特曼。

遵循指令

OpenAI 称:「与我们的初始版本相比,该模型能更可靠地遵循指令。这不仅实现了更精准的编辑,还能处理更复杂的原始构图,按预期保留元素之间的关系。」下面给出了一个对比示例:

文本渲染

该模型在文本渲染方面又迈进了一步,能够处理更密集、更小的文本。

其他质量改进

该模型还在其他维度上进行了改进,使得输出结果能更直接地投入使用,例如渲染许多小尺寸的人脸以及提升输出结果的自然程度。

全新的创作空间

另外,OpenAI 还在 ChatGPT 中推出了全新的「Images」(图片)功能,「旨在让图像生成体验更加令人愉悦 ------ 不仅能激发灵感,还能让创意探索变得毫不费力。」

用户可通过移动应用的侧边栏和 chatgpt.com 访问,让图像的探索和尝试变得更快、更简单。它包含了数十种预设滤镜和提示词以快速激发灵感,并会定期更新以反映新兴趋势。

可用性

全新的 Images 模型于今日起向所有 ChatGPT 用户推出,并通过 API 以 GPT Image 1.5 的形式提供。与 GPT Image 1 相比,GPT Image 1.5 的图像输入和输出价格降低了 20%,因此用户可以在预算不变的情况下生成和迭代更多图像。

ChatGPT 中全新的 Images 体验也于今日向大多数用户开放,商业版(Business)和企业版(Enterprise)的访问权限将在稍后推出。

OpenAI 表示:「我们相信,我们仍处于图像生成所能实现的可能性的开端。今天的更新是向前迈出的有意义的一步,未来还将有更多功能推出,从更细粒度的编辑到跨语言的更丰富、更详细的输出。」

结语

最后,我们也使用一个同样的提示词,简单测试对比了 ChatGPT Images 与谷歌的 Nano Banana Pro。

ChatGPT Images 的结果

Nano Banana Pro 的结果

看起来,至少在这个特定案例中,ChatGPT Images 的结果更加符合我们的指令。

综合来看,在这场 AI 生图之战中,OpenAI 此次发布的 ChatGPT Images 标志着竞争的维度正在变化:从单纯的「模型能力」转向了综合的「产品体验」。OpenAI 这一次甚至没有放出任何量化的基准测试结果!

同时,Sam Altman 亲自下场自黑虽然充满了硅谷式的幽默,但其背后的信号非常清晰:OpenAI 正在极力降低用户的心理门槛。通过推出独立的「Images」入口、预设风格滤镜以及极大幅度的降价,OpenAI 试图将图像生成从一种需要精心调试提示词的专业技能,变成一种像发推特一样简单的日常交互。

你看好 ChatGPT Images 吗?

参考链接

openai.com/index/new-c...

x.com/OpenAI/stat...

相关推荐
行走的小派几秒前
引爆AI智能体时代!OPi 6Plus全面适配OpenClaw
人工智能
云边有个稻草人1 分钟前
CANN:解构AIGC底层算力,ops-nn驱动神经网络算子加速
人工智能·神经网络·aigc·cann
爱吃大芒果1 分钟前
CANN神经网络算子库设计思路:ops-nn项目的工程化实现逻辑
人工智能·深度学习·神经网络
人工智能培训12 分钟前
具身智能如何让智能体理解物理定律?
人工智能·多模态学习·具身智能·ai培训·人工智能工程师·物理定律
lili-felicity12 分钟前
CANN加速Stable Diffusion文生图推理:从UNet优化到内存复用
人工智能·aigc
哈__12 分钟前
CANN加速语音合成TTS推理:声学模型与声码器优化
人工智能
哈__14 分钟前
CANN加速VAE变分自编码器推理:潜在空间重构与编码解码优化
人工智能·深度学习·重构
美狐美颜SDK开放平台18 分钟前
多终端适配下的人脸美型方案:美颜SDK工程开发实践分享
人工智能·音视频·美颜sdk·直播美颜sdk·视频美颜sdk
哈__21 分钟前
CANN加速Image Captioning图像描述生成:视觉特征提取与文本生成优化
人工智能
禁默25 分钟前
Ops-Transformer深入:CANN生态Transformer专用算子库赋能多模态生成效率跃迁
人工智能·深度学习·transformer·cann