GPT-4.1 偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量 OpenAI 痕迹

上线仅三天的神秘模型,已经鲨疯了!

大模型聚合平台 OpenRouter 新推出的 Optimus Alpha,已经处理了 772 亿 Token,平均每天超过 200 亿。

并且这个数字还在上升,日 Token 处理已超过 340 亿,排名第二,并在 Trending 榜单上位列第一。

有网友试着用它挑战 MC-Bench,生成《我的世界》风格的场景,并对比了 4o-mini,结果高下立判:

还有人系统测试了它的编程水平,发现 Optimus Alpha 在 Ruby 语言上是表现最好的模型。

有人更是直接称赞,Optimus Alpha 必须是 SOTA。

惊讶于其优异表现的同时,Optimus Alpha 神秘身份也引发了猜测......

百万上下文窗口,面向现实世界任务

Optimus Alpha 支持百万上下文窗口,最大输出位 32K。

并且响应速度很快,首个 Token 延迟中位数仅有 0.81 秒,输出速度中位数为每秒 24.8 个 Token。

同时介绍中提到,Optimus Alpha 主要面向现实世界中的任务,并特别提及了编程。

有博主让它写一个带购物车功能的电商网站,结果 Optimus Alpha 设计出了合理的 UI 界面,其他很多 AI 都翻车的购物车功能也能正常工作,并且跨越不同文件时也一切正常。

或者写一个贪吃蛇游戏,不仅能正常工作,还加入了蛇头部颜色变化、蛇身颜色渐变等巧妙设计,在新思上胜过了一些其他 AI 编程工具。

甚至还有人用它编写出了 OCR 文字识别应用,支持手写文字的那种。

成绩方面,其 Elo 分数为 1338,在榜单中排名第二,仅次于 Claude 3.7 Sonnet,领先于 DeepSeek-R1,以及疑似 Optimus Alpha 前身的 Quasar Alpha。

特别是在 SQL 数据库查询任务上,Optimus Alpha 取得了最高的平均成绩。

Aider 榜单则显示,Optimus Alpha 的编程能力与 Quasar Alpha,以及 Grok 3 和中号 o3-mini 接近,略胜过 GPT-4.5-preview。

除了编程之外,Optimus Alpha 在创意写作上也表现优异,Elo 分数排名第四,位列 DeepSeek-V3 之后。

神秘模型来自 OpenAI?

最简单粗暴的调查方式,就是直接让模型自己交代。

因为模型发出来的目的就是收集反馈,Optimus Alpha 目前在 OpenRouter 上可以免费使用,也就有了试验的可能。

当被问及身份时,Optimus Alpha 毫不犹豫地说自己是 ChatGPT。

如果追问具体版本,回答则是 "基于 GPT-4,知识截止时间 2024 年 6 月"。

此外,还有人直接根据 Optimus 这个名字,联想到特斯拉的擎天柱机器人,认为神秘模型来自马斯克。

但也有人认为这是奥特曼的障眼法,如果信了它来自马斯克旗下的公司就正中奥特曼下怀了。

而更有说服力的证据,还要从已经下线的 Quasar Alpha 说起,它最早出现在本月 2 日。

Reddit 上有网友发现,在试图用 Quasar Alpha 进行违规操作时,模型的拒绝方式和 OpenAI 非常相似。

而这名网友提到的 Tokenizer bug,指的是更早之前有人发现 Quasar Alpha 在执行中译英任务时出现了 GPT-4o 同款的已读乱回现象。

这个 bug 似乎是 OpenAI 独有,Grok、Claude 以及 DeepSeek 上都不会出现此类情况。

还有人甚至进行了更为复杂的分析------AI 研究员 Sam Paech(前面的创意写作榜单也是他发起的)通过模型回答中的差异,利用信息学方法试图建立模型之间的关联。

结果 Paech 发现,Quasar Alpha 与 OpenAI 的模型极为相近,并且特别点明了是 GPT-4.5-preview。

后来,奥特曼也在推文中暗示了 Quasar Alpha 的身份。

终于可以回到 Optimus Alpha,测试发现,ChatGPT 和 Quasar Alpha 中的同款 bug,再次出现在了其中。

Paech 这边也有新结果,在最新的谱系图中加入了 Optimus Alpha,与其最接近的模型是今年 3 月 27 日更新的 ChatGPT-4o。

而从时间上看,Quasar Alpha 的下架时间是 Optimus Alpha 上线次日,因此有人认为 Optimus Alpha 是 Quasar Alpha 的替代。

除了实验观察到的种种迹象之外,以神秘模型的方式对新模型进行社区测试,已经是 OpenAI 的传统艺能。

加上奥特曼对 Quasar Alpha 的暗示,Optimus Alpha 来自 OpenAI 的概率,整体看还是非常高的。

至于再具体的细节,结合 OpenAI 刚刚泄露出的 "GPT-4.1",被视为是 GPT-4o 的升级,加上 Paech 最新谱系图的印证......

你认为这个神秘模型的真实身份是什么呢?

参考链接:

1\][x.com/TheMattBerm...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2FTheMattBerman%2Fstatus%2F1910813233008509191 "https://x.com/TheMattBerman/status/1910813233008509191") \[2\][www.reddit.com/r/LocalLLaM...](https://link.juejin.cn?target=https%3A%2F%2Fwww.reddit.com%2Fr%2FLocalLLaMA%2Fcomments%2F1jrd0a9%2Fchinese_response_bug_in_tokenizer_suggests%2F "https://www.reddit.com/r/LocalLLaMA/comments/1jrd0a9/chinese_response_bug_in_tokenizer_suggests/") \[3\][x.com/sam_paech/s...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fsam_paech%2Fstatus%2F1910346895110848553 "https://x.com/sam_paech/status/1910346895110848553") **欢迎在评论区留下你的想法!** --- **完** ---

相关推荐
on_pluto_20 小时前
【基础复习1】ROC 与 AUC:逻辑回归二分类例子
人工智能·机器学习·职场和发展·学习方法·1024程序员节
渲吧云渲染1 天前
SaaS模式重构工业软件竞争规则,助力中小企业快速实现数字化转型
大数据·人工智能·sass
算家云1 天前
DeepSeek-OCR本地部署教程:DeepSeek突破性开创上下文光学压缩,10倍效率重构文本处理范式
人工智能·计算机视觉·算家云·模型部署教程·镜像社区·deepseek-ocr
AgeClub1 天前
1.2亿老人需助听器:本土品牌如何以AI破局,重构巨头垄断市场?
人工智能
PPIO派欧云1 天前
PPIO上线Qwen-VL-8B/30B、GLM-4.5-Air等多款中小尺寸模型
人工智能
chenchihwen1 天前
AI代码开发宝库系列:FAISS向量数据库
数据库·人工智能·python·faiss·1024程序员节
张登杰踩1 天前
工业产品表面缺陷检测方法综述:从传统视觉到深度学习
人工智能·深度学习
sponge'1 天前
opencv学习笔记6:SVM分类器
人工智能·机器学习·支持向量机·1024程序员节
zandy10111 天前
2025年AI IDE的深度评测与推荐:从单一功能效率转向生态壁垒
ide·人工智能