GPT-4o重磅发布，第一时间用户测评，OpenAI也存在夸张宣传？

金融机器智能官方2024-05-15 15:00

5月14日凌晨，OpenAI在万众期待的「春季新品发布会」上搬出了新一代旗舰生成模型GPT-4o、桌面App，并展示了一系列新能力。

直播中提到GPT-4o会免费提供给用户，小编早上第一时间登录了自己的账号，然而并没有看到。猜测这个模型还在灰度中，于是氪金化身AI测评博主，对OpenAI官方宣传的GPT-4o模型进行实！际！考！察！

首先，OpenAI官方博客中提到GPT-4o，相比现有模型，在视觉和音频理解方面尤其出色 。

小编观看了OpenAI demo演示视频，OpenAI工作人员与GPT-4o像朋友一样进行视频对话互动，狠狠心动！跃跃欲试！

但是 ! ! !

很遗憾地告诉大家，目前视频交互功能还没对普通用户开放，我们只能通过上传图片和文件来和ChatGPT交互。

另外，官方展示的实时语音翻译功能也引起了吃瓜群众的关注，OpenAI回应手机可以拿来当翻译机来回翻译将近20个常用语言。

小编进行了尝试，发现实时语音翻译也还无法实现.....和ChatGPT语音交互后，还是有几秒的等待时间。

OpenAI在官方博客中也表示"我们计划在接下来几周内，通过API将GPT-4o的新音频和视频功能提供给一小部分可以相信的合作伙伴。"

除了这些大家比较期待但还没办法体验的功能，官方博文中还Po出了一系列的文生图和图像、语音、视频识别的能力展示，接下来小编将就这些能力展！开！测！评！

我们复制了官方博客中Input作为prompt进行生成，将我们自身生成的结果和官方提供的生成图形成对比，供大家参考~

漫画分镜：机器人的写作瓶颈

这个效果展示一方面能体现GPT-4o强大的图片生成能力，包括对图片上文案生成的改进，还能在生成多个图片时能够保持人物的一致性。但效果......

第一张图可以看到自测生成图中文字还是有错字，字迹显示模糊的现象

第二张图中，机器人的手有了明显的变化，没有保持一致，纸张也有了变化

第三张图，基本过关，但纸上的文字已经和前2张图完全不一样了......

漫画分镜：邮差Sally的故事

很好！GPT-4o生成了一张日漫风格的邮差美女，比官方Po出的图片还要好看

等等，怎么画风变了，日漫怎么变木偶了，而且视角也不太对

第三张又换了一个风格，虽说单个的图和文对应得还挺好，但连起来很难讲述一个连贯的故事......

漫画头像

接下来这个功能是小编最喜欢的，也是GPT-4o表现最好的。上传一张照片，为你设计漫画头像，背景也可以自定义。

这是原图，OpenAI的技术小哥Alex Nichol

这是GPT-4o生成的漫画头像，虽说自测没有官方生成的写实，但也还原了基本特征。

艺术字体

效果很赞，甚至比官方出图还赞！

但是字母怎么越来越少了😂

3D效果图

美观度够了，但logo改成这个样子还能用吗？

创意排版

手写体是挺优美的，但文本准确度还是有点差......

人物情绪识别

小编上传了一张情绪丰富的人物照片，GPT-4o非常准确地识别了出来，还编了故事一段故事。

会议录音识别

小编上传了一段多人的会议录音，问它这段录音中有几个人，GPT-4o通过音轨的分析来给出了一个答案，就有些离谱......

从整体的实际体验来看，目前普通用户能用到的GPT-4o并没有宣传中的那么好用，这次的发布更像是一次仓促的PR行为，没有看到太多的诚意。小编并不怀疑OpenAI发布的视频像明天的主角Google一样有剪辑视频的嫌疑，但显然视频中OpenAI员工手机里用的GPT-4o和我现在用的不太一样，至于啥时候能内外同源，只能期待了。🤩

文章推荐

OpenAI直播倒计时，GPT-5被证缺席，GPT-3.5至5，一文看懂AI进化大不同！

AI日报｜Sam Altman谈GPT-5与去年"宫斗"事件，李开复首谈ChatGPT...

蚁起同乐！蚂蚁"510亲友日"AI心愿奇妙之旅

"可信 AI 进展 " 公众号致力于最新可信人工智能技术的传播和开源技术的培育，覆盖大规模图学习，因果推理，知识图谱，大模型等技术领域，欢迎扫码关注，解锁更多 AI 资讯～

上一篇：MIT 6.5840(6.824) Lab2:Key/Value Server 设计实现

下一篇：qt: undefined reference to `vtable for aaa‘

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 06微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI科技热点日报 | 2026年07月01日 092026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一 102026 年 AI 大模型 & AI 编程工具实战全总结