GPT-4.1 偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量 OpenAI 痕迹

上线仅三天的神秘模型,已经鲨疯了!

大模型聚合平台 OpenRouter 新推出的 Optimus Alpha,已经处理了 772 亿 Token,平均每天超过 200 亿。

并且这个数字还在上升,日 Token 处理已超过 340 亿,排名第二,并在 Trending 榜单上位列第一。

有网友试着用它挑战 MC-Bench,生成《我的世界》风格的场景,并对比了 4o-mini,结果高下立判:

还有人系统测试了它的编程水平,发现 Optimus Alpha 在 Ruby 语言上是表现最好的模型。

有人更是直接称赞,Optimus Alpha 必须是 SOTA。

惊讶于其优异表现的同时,Optimus Alpha 神秘身份也引发了猜测......

百万上下文窗口,面向现实世界任务

Optimus Alpha 支持百万上下文窗口,最大输出位 32K。

并且响应速度很快,首个 Token 延迟中位数仅有 0.81 秒,输出速度中位数为每秒 24.8 个 Token。

同时介绍中提到,Optimus Alpha 主要面向现实世界中的任务,并特别提及了编程。

有博主让它写一个带购物车功能的电商网站,结果 Optimus Alpha 设计出了合理的 UI 界面,其他很多 AI 都翻车的购物车功能也能正常工作,并且跨越不同文件时也一切正常。

或者写一个贪吃蛇游戏,不仅能正常工作,还加入了蛇头部颜色变化、蛇身颜色渐变等巧妙设计,在新思上胜过了一些其他 AI 编程工具。

甚至还有人用它编写出了 OCR 文字识别应用,支持手写文字的那种。

成绩方面,其 Elo 分数为 1338,在榜单中排名第二,仅次于 Claude 3.7 Sonnet,领先于 DeepSeek-R1,以及疑似 Optimus Alpha 前身的 Quasar Alpha。

特别是在 SQL 数据库查询任务上,Optimus Alpha 取得了最高的平均成绩。

Aider 榜单则显示,Optimus Alpha 的编程能力与 Quasar Alpha,以及 Grok 3 和中号 o3-mini 接近,略胜过 GPT-4.5-preview。

除了编程之外,Optimus Alpha 在创意写作上也表现优异,Elo 分数排名第四,位列 DeepSeek-V3 之后。

神秘模型来自 OpenAI?

最简单粗暴的调查方式,就是直接让模型自己交代。

因为模型发出来的目的就是收集反馈,Optimus Alpha 目前在 OpenRouter 上可以免费使用,也就有了试验的可能。

当被问及身份时,Optimus Alpha 毫不犹豫地说自己是 ChatGPT。

如果追问具体版本,回答则是 "基于 GPT-4,知识截止时间 2024 年 6 月"。

此外,还有人直接根据 Optimus 这个名字,联想到特斯拉的擎天柱机器人,认为神秘模型来自马斯克。

但也有人认为这是奥特曼的障眼法,如果信了它来自马斯克旗下的公司就正中奥特曼下怀了。

而更有说服力的证据,还要从已经下线的 Quasar Alpha 说起,它最早出现在本月 2 日。

Reddit 上有网友发现,在试图用 Quasar Alpha 进行违规操作时,模型的拒绝方式和 OpenAI 非常相似。

而这名网友提到的 Tokenizer bug,指的是更早之前有人发现 Quasar Alpha 在执行中译英任务时出现了 GPT-4o 同款的已读乱回现象。

这个 bug 似乎是 OpenAI 独有,Grok、Claude 以及 DeepSeek 上都不会出现此类情况。

还有人甚至进行了更为复杂的分析------AI 研究员 Sam Paech(前面的创意写作榜单也是他发起的)通过模型回答中的差异,利用信息学方法试图建立模型之间的关联。

结果 Paech 发现,Quasar Alpha 与 OpenAI 的模型极为相近,并且特别点明了是 GPT-4.5-preview。

后来,奥特曼也在推文中暗示了 Quasar Alpha 的身份。

终于可以回到 Optimus Alpha,测试发现,ChatGPT 和 Quasar Alpha 中的同款 bug,再次出现在了其中。

Paech 这边也有新结果,在最新的谱系图中加入了 Optimus Alpha,与其最接近的模型是今年 3 月 27 日更新的 ChatGPT-4o。

而从时间上看,Quasar Alpha 的下架时间是 Optimus Alpha 上线次日,因此有人认为 Optimus Alpha 是 Quasar Alpha 的替代。

除了实验观察到的种种迹象之外,以神秘模型的方式对新模型进行社区测试,已经是 OpenAI 的传统艺能。

加上奥特曼对 Quasar Alpha 的暗示,Optimus Alpha 来自 OpenAI 的概率,整体看还是非常高的。

至于再具体的细节,结合 OpenAI 刚刚泄露出的 "GPT-4.1",被视为是 GPT-4o 的升级,加上 Paech 最新谱系图的印证......

你认为这个神秘模型的真实身份是什么呢?

参考链接:

1\][x.com/TheMattBerm...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2FTheMattBerman%2Fstatus%2F1910813233008509191 "https://x.com/TheMattBerman/status/1910813233008509191") \[2\][www.reddit.com/r/LocalLLaM...](https://link.juejin.cn?target=https%3A%2F%2Fwww.reddit.com%2Fr%2FLocalLLaMA%2Fcomments%2F1jrd0a9%2Fchinese_response_bug_in_tokenizer_suggests%2F "https://www.reddit.com/r/LocalLLaMA/comments/1jrd0a9/chinese_response_bug_in_tokenizer_suggests/") \[3\][x.com/sam_paech/s...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fsam_paech%2Fstatus%2F1910346895110848553 "https://x.com/sam_paech/status/1910346895110848553") **欢迎在评论区留下你的想法!** --- **完** ---

相关推荐
2202_7567496914 分钟前
01 基于sklearn的机械学习-机械学习的分类、sklearn的安装、sklearn数据集及数据集的划分、特征工程(特征提取与无量纲化、特征降维)
人工智能·python·机器学习·分类·sklearn
SoFlu软件机器人15 分钟前
飞算科技:以原创之力,开启Java开发新纪元与行业数智变革
人工智能·科技
沫儿笙26 分钟前
OTC焊接机器人节能技巧
大数据·人工智能·机器人
西柚小萌新1 小时前
【人工智能agent】--服务器部署PaddleX 的 印章文本识别模型
人工智能
金融小师妹1 小时前
AI量化模型解析黄金3300关口博弈:市场聚焦“非农数据”的GRU-RNN混合架构推演
大数据·人工智能·算法
NewCarRen1 小时前
数据驱动的自动驾驶虚拟测试方法
人工智能·机器学习·自动驾驶
金融小师妹1 小时前
基于LSTM-GRU混合网络的动态解析:美联储维稳政策与黄金单日跌1.5%的非线性关联
大数据·人工智能·算法
海岸线科技1 小时前
汽车供应链PPAP自动化审核指南:如何用AI实现规则精准匹配与文件智能校验
人工智能·自动化·汽车
demaichuandong1 小时前
丝杆升降机在物流运输领域有哪些应用场景
人工智能·自动化·信号处理
CareyWYR1 小时前
每周AI论文速递(250728-250801)
人工智能