日本发布比肩Fable5的模型?Fugu Ultra初探!

今天一打开手机,看到了一条非常新鲜的消息!

听说日本发布了一款叫 Fugu Ultra 的模型,性能比肩 Fable 5 和 Mythos!

然后贴了这样一张图片:

从图片来看,确实很强的样子!!!

有些基准数据比 Mythos 和 Fable 5 都还要强!

编程能力比 Opus4.8 强,比 Fable 5 弱一些。

这数据非常亮眼啊。我从来没有听说过日本的模型,这次突然听到真是充满了好奇感!

然后我就查了一下资料:

Sakana AI 于 2026 年 6 月 22 日 正式发布了这款新产品。它的核心反差点在于:它不是又一个更大的基础模型,而是"一个被训练用来调度其他模型的模型" ------一个指挥家(conductor)式的语言模型。

对外它表现得像一个普通模型:你调一个 API 端点就行;对内它是一整套多智能体编排系统。Fugu 自己会判断------简单问题直接答,复杂的多步骤任务就临时组建并协调一支"专家模型小队",模型选择、任务分派、结果验证、答案合成全部在内部完成,调用方的代码里完全看不到多智能体的复杂度。它甚至能递归调用自己。

这......这不就是一个"智能中转站 "么?类似 OpenAI 不同模型的"内部路由"!那这个和 Mythos、Fable 5 去比,这不是搞笑么。

如果从对标 Mythos 的切入点来看确实有点搞笑,但是从它的卖点来看,确实也有点意思。

主要卖点

1. 单一 API,隐藏全部复杂度 一个 OpenAI 兼容端点,把"多智能体系统"的麻烦事全部封装掉。你不用自己搭编排框架、不用管路由和调度。

2. 前沿性能,但不绑定单一厂商

官方称 Fugu Ultra 在工程、科学、推理等高难度基准上能和 Anthropic 的 Fable 5、Mythos Preview 等顶级模型"平起平坐",也声称在多项应用上超过 Gemini 3.1 Pro、Opus 4.8、GPT-5.5。(注意:这些是 Sakana 自己报告的数据,第三方对比基准之外的部分还需独立验证。)

3. "绕开供应链风险"

这是他们这次主打的最大叙事!底层模型池是可随时替换的。

如果某家供应商断供(他们直接点名了近期 Anthropic 的 Fable / Mythos 因出口管制而访问受限),Fugu 会动态绕路。他们把这个上升到"AI 主权(AI sovereignty)"的高度,主打给那些把 AI 用在关键基础设施、金融、政务上、不愿被单一厂商卡脖子的组织和国家。

4. 两个档位,按需选择

  • Fugu:性能与低延迟平衡,日常默认款,适合编程、代码审查、聊天机器人等交互场景;支持把特定 agent 移出池子以满足数据/隐私/合规要求。
  • Fugu Ultra:冲最高答案质量的硬核多步骤任务,调动更深的专家池。

5. 强在"长链条、脏活、累活" 官方反复强调它的价值不在单条 prompt 答得多好,而在长跑------读、实现、测试、比对、找漏、出报告,能在很多步骤里持续推进。近 500 人的 beta 反馈集中在代码审查("别人指出 3 个 bug,它揪出 20 多个")、几乎全自动的数据科学研究、端到端安全评估,以及长会话里人格/角色稳定不漂移

6. 会自我进化 因为靠的是"学习来的编排"而非写死的工作流,生态里出现更新更强的模型时,直接纳入 agent 池,收益顺带传给用户。

所以,从模型上来讲,这个东西没啥东西,但是从实用性的角度来看,好像确实可以。

它在官方 GitHub 上放了几个例子:

在这几类场景中,表现好像挺不错的!

其实对它的能力上限,我们已经基本上清楚了,最强的那个底层模型就是它的能力上限。接下来就看看价格了。

收费情况

收费方面它们提供了两种方式。一种是订阅制,一种是用多少付多少。

订阅制三档:Standard 20、Pro20、Pro 20、Pro100(10× 额度)、Max $200(20× 额度)/ 月,都含两个型号。

哇,这个价格和 Claude 的定价策略一模一样啊!

按量付费。Fugu Ultra(fugu-ultra-20260615)每百万 token:输入 5/输出5 / 输出 5/输出30 / 缓存输入 $0.50,上下文超 272K 翻倍。

2026 年 7 月底前订阅送第二个月免费。

这个 API 价格和 Opus4.8 比较接近,比 Fable 5 确实便宜很多。

如果它能给我把 Fable 5 配上,我觉得这个套餐价格和 API 价格确实也挺实惠的。

为此我还特地去它们官网观察了一下:

网页设计倒是挺简洁的!

官网也提供了 Chat 功能,我用谷歌账号登录,随便聊了一句:

然后也可以通过 API 接入:

这个 API 创建窗口,直接可以选择调用哪些模型!这个设计......这不妥妥的中转站啊!当然它是加了个专门的模型来进行智能调度,如果调度得好,确实可以既省成本,又能用上高性能模型。

它们现在是主打 Codex 接入,走 OpenAI 的协议:

scala 复制代码
export SAKANA_API_KEY={your api key}
​
curl -X POST https://api.sakana.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $SAKANA_API_KEY" \
  -d '{"model":"fugu","messages":[{"role":"user","content":"How many r in word strawberry"}]}'
​
​

我试了一下,在国内打开速度奇快,账单地址支持选中国!我好像有点心动了。

要不订阅一个月,测试一波?

主要还是看他们订阅套餐的配额怎么样,以及是否能够接入 Fable 等模型(估计没戏)!

这种调度系统最大的坑就是你压根不知道你调用的是什么模型。搞不好就是付了 Mythos 的钱,给你 Haiku 模型!打个形象的比喻就是:你点的是西施,它给你的是如花,灯下黑你也看不清楚

相关推荐
雪隐1 小时前
个人电脑玩AI-04让5060 Ti给你打工——本地FLUX.2 Klein 的 AI 图片生成
人工智能·后端
腾讯云开发者2 小时前
腾讯云TVP走进香港数码港,解码AI出海新范式
人工智能
沉默王二2 小时前
无限期免费,Token 随便用,舒服啊!
agent·ai编程
用户47949283569152 小时前
又当又立: Anthropic 这篇安全白皮书,为什么让人恶心
人工智能
threerocks2 小时前
AI编程的商业模式已经在互联网大厂跑通了
程序员·aigc·ai编程
Darling噜啦啦2 小时前
AI Loop 自迭代循环实战:让 AI 自动写文案直到完美——从 Prompt 工程到 Loop 工程
人工智能
vanuan2 小时前
MCP协议实战(Python版):让AI直接查你的数据库
人工智能
Vuhao2 小时前
为什么同样的问题,别人的AI回答质量高40%?
人工智能
Vuhao2 小时前
如何创造自己的工作流
人工智能