上线仅三天的神秘模型,已经鲨疯了!
大模型聚合平台 OpenRouter 新推出的 Optimus Alpha,已经处理了 772 亿 Token,平均每天超过 200 亿。
并且这个数字还在上升,日 Token 处理已超过 340 亿,排名第二,并在 Trending 榜单上位列第一。

有网友试着用它挑战 MC-Bench,生成《我的世界》风格的场景,并对比了 4o-mini,结果高下立判:

还有人系统测试了它的编程水平,发现 Optimus Alpha 在 Ruby 语言上是表现最好的模型。

有人更是直接称赞,Optimus Alpha 必须是 SOTA。

惊讶于其优异表现的同时,Optimus Alpha 神秘身份也引发了猜测......
百万上下文窗口,面向现实世界任务
Optimus Alpha 支持百万上下文窗口,最大输出位 32K。
并且响应速度很快,首个 Token 延迟中位数仅有 0.81 秒,输出速度中位数为每秒 24.8 个 Token。

同时介绍中提到,Optimus Alpha 主要面向现实世界中的任务,并特别提及了编程。
有博主让它写一个带购物车功能的电商网站,结果 Optimus Alpha 设计出了合理的 UI 界面,其他很多 AI 都翻车的购物车功能也能正常工作,并且跨越不同文件时也一切正常。

或者写一个贪吃蛇游戏,不仅能正常工作,还加入了蛇头部颜色变化、蛇身颜色渐变等巧妙设计,在新思上胜过了一些其他 AI 编程工具。

甚至还有人用它编写出了 OCR 文字识别应用,支持手写文字的那种。

成绩方面,其 Elo 分数为 1338,在榜单中排名第二,仅次于 Claude 3.7 Sonnet,领先于 DeepSeek-R1,以及疑似 Optimus Alpha 前身的 Quasar Alpha。

特别是在 SQL 数据库查询任务上,Optimus Alpha 取得了最高的平均成绩。

Aider 榜单则显示,Optimus Alpha 的编程能力与 Quasar Alpha,以及 Grok 3 和中号 o3-mini 接近,略胜过 GPT-4.5-preview。

除了编程之外,Optimus Alpha 在创意写作上也表现优异,Elo 分数排名第四,位列 DeepSeek-V3 之后。

神秘模型来自 OpenAI?
最简单粗暴的调查方式,就是直接让模型自己交代。
因为模型发出来的目的就是收集反馈,Optimus Alpha 目前在 OpenRouter 上可以免费使用,也就有了试验的可能。
当被问及身份时,Optimus Alpha 毫不犹豫地说自己是 ChatGPT。
如果追问具体版本,回答则是 "基于 GPT-4,知识截止时间 2024 年 6 月"。

此外,还有人直接根据 Optimus 这个名字,联想到特斯拉的擎天柱机器人,认为神秘模型来自马斯克。

但也有人认为这是奥特曼的障眼法,如果信了它来自马斯克旗下的公司就正中奥特曼下怀了。

而更有说服力的证据,还要从已经下线的 Quasar Alpha 说起,它最早出现在本月 2 日。
Reddit 上有网友发现,在试图用 Quasar Alpha 进行违规操作时,模型的拒绝方式和 OpenAI 非常相似。

而这名网友提到的 Tokenizer bug,指的是更早之前有人发现 Quasar Alpha 在执行中译英任务时出现了 GPT-4o 同款的已读乱回现象。

这个 bug 似乎是 OpenAI 独有,Grok、Claude 以及 DeepSeek 上都不会出现此类情况。

还有人甚至进行了更为复杂的分析------AI 研究员 Sam Paech(前面的创意写作榜单也是他发起的)通过模型回答中的差异,利用信息学方法试图建立模型之间的关联。
结果 Paech 发现,Quasar Alpha 与 OpenAI 的模型极为相近,并且特别点明了是 GPT-4.5-preview。

后来,奥特曼也在推文中暗示了 Quasar Alpha 的身份。

终于可以回到 Optimus Alpha,测试发现,ChatGPT 和 Quasar Alpha 中的同款 bug,再次出现在了其中。

Paech 这边也有新结果,在最新的谱系图中加入了 Optimus Alpha,与其最接近的模型是今年 3 月 27 日更新的 ChatGPT-4o。

而从时间上看,Quasar Alpha 的下架时间是 Optimus Alpha 上线次日,因此有人认为 Optimus Alpha 是 Quasar Alpha 的替代。

除了实验观察到的种种迹象之外,以神秘模型的方式对新模型进行社区测试,已经是 OpenAI 的传统艺能。
加上奥特曼对 Quasar Alpha 的暗示,Optimus Alpha 来自 OpenAI 的概率,整体看还是非常高的。
至于再具体的细节,结合 OpenAI 刚刚泄露出的 "GPT-4.1",被视为是 GPT-4o 的升级,加上 Paech 最新谱系图的印证......

你认为这个神秘模型的真实身份是什么呢?
参考链接:
1\][x.com/TheMattBerm...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2FTheMattBerman%2Fstatus%2F1910813233008509191 "https://x.com/TheMattBerman/status/1910813233008509191") \[2\][www.reddit.com/r/LocalLLaM...](https://link.juejin.cn?target=https%3A%2F%2Fwww.reddit.com%2Fr%2FLocalLLaMA%2Fcomments%2F1jrd0a9%2Fchinese_response_bug_in_tokenizer_suggests%2F "https://www.reddit.com/r/LocalLLaMA/comments/1jrd0a9/chinese_response_bug_in_tokenizer_suggests/") \[3\][x.com/sam_paech/s...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fsam_paech%2Fstatus%2F1910346895110848553 "https://x.com/sam_paech/status/1910346895110848553") **欢迎在评论区留下你的想法!** --- **完** ---