日本发布比肩Fable5的模型？Fugu Ultra初探！

今天一打开手机，看到了一条非常新鲜的消息！

听说日本发布了一款叫 Fugu Ultra 的模型，性能比肩 Fable 5 和 Mythos！

然后贴了这样一张图片：

从图片来看，确实很强的样子！！！

有些基准数据比 Mythos 和 Fable 5 都还要强！

编程能力比 Opus4.8 强，比 Fable 5 弱一些。

这数据非常亮眼啊。我从来没有听说过日本的模型，这次突然听到真是充满了好奇感！

然后我就查了一下资料：

Sakana AI 于 2026 年 6 月 22 日 正式发布了这款新产品。它的核心反差点在于：它不是又一个更大的基础模型，而是"一个被训练用来调度其他模型的模型" ------一个指挥家（conductor）式的语言模型。

对外它表现得像一个普通模型：你调一个 API 端点就行；对内它是一整套多智能体编排系统。Fugu 自己会判断------简单问题直接答，复杂的多步骤任务就临时组建并协调一支"专家模型小队"，模型选择、任务分派、结果验证、答案合成全部在内部完成，调用方的代码里完全看不到多智能体的复杂度。它甚至能递归调用自己。

这......这不就是一个"智能中转站 "么？类似 OpenAI 不同模型的"内部路由"！那这个和 Mythos、Fable 5 去比，这不是搞笑么。

如果从对标 Mythos 的切入点来看确实有点搞笑，但是从它的卖点来看，确实也有点意思。

主要卖点

1. 单一 API，隐藏全部复杂度 一个 OpenAI 兼容端点，把"多智能体系统"的麻烦事全部封装掉。你不用自己搭编排框架、不用管路由和调度。

2. 前沿性能，但不绑定单一厂商

官方称 Fugu Ultra 在工程、科学、推理等高难度基准上能和 Anthropic 的 Fable 5、Mythos Preview 等顶级模型"平起平坐"，也声称在多项应用上超过 Gemini 3.1 Pro、Opus 4.8、GPT-5.5。（注意：这些是 Sakana 自己报告的数据，第三方对比基准之外的部分还需独立验证。）

3. "绕开供应链风险"

这是他们这次主打的最大叙事！底层模型池是可随时替换的。

如果某家供应商断供（他们直接点名了近期 Anthropic 的 Fable / Mythos 因出口管制而访问受限），Fugu 会动态绕路。他们把这个上升到"AI 主权（AI sovereignty）"的高度，主打给那些把 AI 用在关键基础设施、金融、政务上、不愿被单一厂商卡脖子的组织和国家。

4. 两个档位，按需选择

Fugu：性能与低延迟平衡，日常默认款，适合编程、代码审查、聊天机器人等交互场景；支持把特定 agent 移出池子以满足数据/隐私/合规要求。
Fugu Ultra：冲最高答案质量的硬核多步骤任务，调动更深的专家池。

5. 强在"长链条、脏活、累活" 官方反复强调它的价值不在单条 prompt 答得多好，而在长跑------读、实现、测试、比对、找漏、出报告，能在很多步骤里持续推进。近 500 人的 beta 反馈集中在代码审查（"别人指出 3 个 bug，它揪出 20 多个"）、几乎全自动的数据科学研究、端到端安全评估，以及长会话里人格/角色稳定不漂移。

6. 会自我进化 因为靠的是"学习来的编排"而非写死的工作流，生态里出现更新更强的模型时，直接纳入 agent 池，收益顺带传给用户。

所以，从模型上来讲，这个东西没啥东西，但是从实用性的角度来看，好像确实可以。

它在官方 GitHub 上放了几个例子：

在这几类场景中，表现好像挺不错的！

其实对它的能力上限，我们已经基本上清楚了，最强的那个底层模型就是它的能力上限。接下来就看看价格了。

收费情况

收费方面它们提供了两种方式。一种是订阅制，一种是用多少付多少。

订阅制三档：Standard $20、Pro20、Pro$ 20、Pro100（10× 额度）、Max $200（20× 额度）/ 月，都含两个型号。

哇，这个价格和 Claude 的定价策略一模一样啊！

按量付费。Fugu Ultra（fugu-ultra-20260615）每百万 token：输入 $5/输出5 / 输出$ 5/输出30 / 缓存输入 $0.50，上下文超 272K 翻倍。

2026 年 7 月底前订阅送第二个月免费。

这个 API 价格和 Opus4.8 比较接近，比 Fable 5 确实便宜很多。

如果它能给我把 Fable 5 配上，我觉得这个套餐价格和 API 价格确实也挺实惠的。

为此我还特地去它们官网观察了一下：

网页设计倒是挺简洁的！

官网也提供了 Chat 功能，我用谷歌账号登录，随便聊了一句：

然后也可以通过 API 接入：

这个 API 创建窗口，直接可以选择调用哪些模型！这个设计......这不妥妥的中转站啊！当然它是加了个专门的模型来进行智能调度，如果调度得好，确实可以既省成本，又能用上高性能模型。

它们现在是主打 Codex 接入，走 OpenAI 的协议：

scala 复制代码

export SAKANA_API_KEY={your api key}

curl -X POST https://api.sakana.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $SAKANA_API_KEY" \
  -d '{"model":"fugu","messages":[{"role":"user","content":"How many r in word strawberry"}]}'

我试了一下，在国内打开速度奇快，账单地址支持选中国！我好像有点心动了。

要不订阅一个月，测试一波？

主要还是看他们订阅套餐的配额怎么样，以及是否能够接入 Fable 等模型（估计没戏）！

这种调度系统最大的坑就是你压根不知道你调用的是什么模型。搞不好就是付了 Mythos 的钱，给你 Haiku 模型！打个形象的比喻就是：你点的是西施，它给你的是如花，灯下黑你也看不清楚。