GPT-4o 图像生成今起免费!奥特曼坐镇紧急发布,指令遵循 / 文本控制表现惊艳

OpenAI 全量开放 GPT-4o 图像生成 能力,这回免费用户第一时间上车!

即日起在 ChatGPT 和 Sora 中,向所有 Plus、Pro、Team 和免费用户推出。

一夜之间,各种实测结果刷屏。最惊艳的莫过于对文本的处理能力。

比如,4o 可以 100% 还原文字内容,且指定文字摆放位置。

男人右手举着 "a few",左手举着 "words"

还能像连续剧一样,一边准确生成文字,一边变换人物动作。

仔细对比两张图,第一张白板中的男人倒影和第二张图也对应上了。

昨晚 OpenAI 突然宣布要开个小直播发布,这回奥特曼出现了(前情:GPT-4.5 发布时他由于带娃没来)。

直播中展示了各种玩法,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。

直接现场咔嚓一张自拍,然后立马转成动漫风格。

顺带官方玩梗制作 meme 图,要求在图片中添加 "feel the agi"。(没错,生成时还知道将小写换成更符合的大写)

现在,打开 ChatGPT,即可尝试这些能力。

实测生成速度很快(大约十几秒一张),但普通用户每天仅有 3 次体验机会。

API 预计将在未来几周内逐步推出。

这波主打一个美观又实用

我们终于迈向了这种真正集成的多模态模型。

按照官方介绍,作为多模态模型的 4o 现在终于补齐了一块重要拼图------图片生成。

而且主打一个美观实用两手抓。

话不多说,我们直接来看其能力升级的具体表现。

各项能力大升级

首先,OpenAI 表示 4o 现在能精确融合符号和图片了。

比如直接给一段文字,然后生成一张制作精美的菜单:

而且支持在多轮对话中逐步调整图片内容和风格。

类似下面这样,提供一张猫猫原图,然后一步步创建一个游戏角色:




此外还非常注重细节,官方称 4o 可以处理多达 10-20 个不同的物体,而其他模型一般在处理 5-8 个物体时就会遇到困难。


除了上述,4o 在生成真实图像方面也表现出色。


连现实版 "照猫画虎" 也有了(doge):

网友实测 ing

看完官方宣传效果,网友们也赶紧来了一波实测~

经典梗图第一时间申请出战,画面还真毫无违和感 hhh。

甚至,复现同款书写图也是不在话下:

One More Thing

话说最近这两天也过于热闹了,DeepSeek、OpenAI 和谷歌几乎同台开战。

值得一提的是,昨晚 11 点(北京时间)OpenAI 突然宣布将有小发布,而 DeepSeek 刚刚发布了 DeepSeek-v3-0324 的官方技术报告。

不知道是不是被 DS 逼出来的新发布呢?(doge)

参考链接:

1\][openai.com/index/intro...](https://link.juejin.cn?target=https%3A%2F%2Fopenai.com%2Findex%2Fintroducing-4o-image-generation%2F "https://openai.com/index/introducing-4o-image-generation/") \[2\][x.com/chatgpt21/s...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fchatgpt21%2Fstatus%2F1904683763914674208 "https://x.com/chatgpt21/status/1904683763914674208") **欢迎在评论区留下你的想法!** --- **完** ---

相关推荐
用户51914958484513 分钟前
WordPress开放嵌入自动发现功能中的XSS漏洞分析
人工智能·aigc
失散131 小时前
自然语言处理——03 RNN及其变体
人工智能·rnn·自然语言处理·gru·lstm
Jinkxs1 小时前
告别人工建模:AI 自动化 ETL 工具对比,数据 pipeline 搭建时间缩短 60% 的实践
人工智能·自动化·etl
B612 little star king1 小时前
UNIKGQA论文笔记
论文阅读·人工智能·笔记·自然语言处理·知识图谱
BertieHuang2 小时前
(一)深入源码,从 0 到 1 实现 Cursor
人工智能·python·程序员
reddish2 小时前
用大模型“语音指挥”网站运维?MCP + Coze 实现无代码自动化管理实战
人工智能·程序员·架构
♡喜欢做梦2 小时前
企业级大模型解决方案:架构、落地与代码实现
人工智能·ai·架构
Coovally AI模型快速验证2 小时前
全景式综述|多模态目标跟踪全面解析:方法、数据、挑战与未来
人工智能·深度学习·算法·机器学习·计算机视觉·目标跟踪·无人机
双向332 小时前
当Trae遇上高德MCP:一次国庆武汉之旅的AI技术实践
人工智能·trae
格林威2 小时前
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型和EasyOCR实现汽车牌照动态检测和识别(C#代码,UI界面版)
人工智能·深度学习·数码相机·yolo·c#·汽车·视觉检测