Claude Fable 5 发布:最强模型来了,但带了把锁
Anthropic 昨天丢了个大炸弹:Claude Fable 5 和 Claude Mythos 5 同时发布。Fable 5 是面向所有用户的最强版本,Mythos 5 是解锁安全限制的特供版------只给网络防御者和基础设施提供者用。
这条消息的分量不轻。它不只是"又发了个新模型",而是 Anthropic 第一次把 Mythos 级能力做成公开产品,同时用一套安全机制做了物理隔离。
看完这篇你能知道:
- Fable 5 到底比 Opus 4.8 强在哪
- 那个"5% 请求被转走"的安全机制意味着什么
- 定价砍半背后,Anthropic 在打什么算盘
不只是 benchmark 更高
先说能力。Anthropic 的原话是"Fable 5 在几乎所有测试 benchmark 上都是 SOTA"。这话每个模型厂都说过,但这次有几个具体数据值得看:
软件工程:Stripe 测试时,Fable 5 在一个 5000 万行 Ruby 代码库里用一天完成了原本需要整个团队两个月的手动迁移。Cognition 的 FrontierCode 评测(测试模型在高质量生产代码库中完成困难编程任务的能力)里,Fable 5 在中等 effort 下就拿了最高分。
知识工作:Hebbia 的金融 benchmark(高级推理测试)中,Fable 5 拿到所有模型最高分,尤其在文档推理、图表解读和问题求解上提升明显。IMC 说它在交易分析评测中几乎全线满分。
视觉:能从复杂科学图表中提取精确数字,能从截图反向重建 Web 应用源码。之前的 Claude 模型玩宝可梦火红需要额外工具辅助,Fable 5 用纯视觉方案就通关了。
长上下文和记忆:在百万 token 级别的长任务中保持专注,并能用自己写的笔记改进输出。在卡牌游戏 Slay the Spire 测试中,持久化记忆对 Fable 5 性能的提升是 Opus 4.8 的三倍。
这些数字背后有一个共同趋势:任务越长、越复杂,Fable 5 的领先越大。 短任务上它可能只是略强,但一旦涉及多步骤自主工作,差距就拉开。
安全机制:一把值得讨论的锁
Fable 5 的能力强到 Anthropic 自己都觉得需要加限制。具体做法是:当用户查询涉及某些敏感领域(比如网络安全攻击),系统会把请求转给 Claude Opus 4.8 处理,而不是用 Fable 5 响应。
Anthropic 说这个机制平均在不到 5% 的会话中触发,但也承认调得比较保守,偶尔会误拦无害请求。
这是一把双刃剑。
从安全角度看,这是负责任的做法。Fable 5 在网络安全领域的能力确实可以被滥用------Mythos 5 的特供版就是专门给网络防御者用的,说明 Anthropic 清楚这个模型在网络攻防两端都有极强能力。
但从用户体验角度看,这意味着你用 Fable 5 时,有 1/20 的概率拿到的是降级响应,而且你事先不知道哪些话题会被拦截。对开发者来说,这种不确定性可能比能力上限更让人头疼。
Mythos 5 则是完全解锁的版本,通过 Project Glasswing 与美国政府合作部署,目前已用于保护关键基础设施软件。Anthropic 计划后续扩大到更广泛的可信访问计划。
定价砍半,但账不是这么算的
Fable 5 和 Mythos 5 定价:输入 10/百万token,输出50/百万 token。相比 Claude Mythos Preview,价格砍了一半以上。
这个定价策略有意思。Anthropic 的叙事是"让更多用户尽快用上先进 AI",但我更倾向于从竞争角度理解:OpenAI 的 GPT-5.5 已经在市场上跑了一段时间,Anthropic 需要在价格上制造压力。
不过要注意,$50/百万输出 token 并不便宜。如果你用 Fable 5 跑长任务(它最擅长的那种),token 消耗会很可观。一个月下来,账单可能比你预期的高不少。
落地场景:哪些人会立刻上车
从早期测试反馈来看,最兴奋的是这几类人:
编程工具厂商:GitHub 说 Fable 5 "在自主性和可靠性上超越了之前的 benchmark",Cursor 说它在 CursorBench 上拿了 SOTA。Cognition 说它是 FrontierBench 最高分模型,擅长长时推理和陌生工具泛化。
金融分析:Hebbia 和 IMC 都给了高分评价,尤其在结构化推理和文档分析上。
法律领域:有律所反馈,盲测中 Fable 5 的合同修改质量每次都匹配或超过现有模型。
生命科学:Mythos 5 在药物设计上把某些流程加速了 10 倍,还独立产生了分子生物学新假说------其中一个是独立实验室后续验证过的。
反方声音:这真的重要吗?
反方会说:每次模型厂发新模型都说"全面超越",但实际用起来提升往往没有数字那么夸张。benchmark 和真实工作流之间隔着一道鸿沟。
这个质疑有道理。我见过太多模型在评测中表现惊艳、到具体业务里水土不服的案例。
但这次我倾向于认为 Fable 5 的提升是实质性的。原因有二:
第一,Stripe 和 GitHub 的反馈不是来自标准化 benchmark,而是来自它们自己的内部测试------在真实代码库、真实任务上跑出来的结论。
第二,Anthropic 把安全机制做成"转给 Opus 4.8"而不是"完全拦截",说明它对 Fable 5 和 Opus 4.8 之间的能力差距有明确判断。如果差距不大,没必要搞这套。
我的判断
Fable 5 最值得关注的不是某个单项能力的提升,而是它在长任务上的表现。之前的大模型更像"聪明的实习生"------能做单步任务,但一到需要多步推理、自主决策的场景就容易崩。Fable 5 似乎在往"初级工程师"的方向迈了一步。
但安全机制的 5% 转发率是个需要持续观察的指标。如果这个数字随着使用量上升而增加,或者误拦变得更频繁,那对需要稳定性的生产环境来说就是个硬伤。
你需要做什么
- 如果你在用 Claude 做开发:今天就可以在 Cursor 或 Claude Code 里切到 Fable 5 试一下,重点关注长任务场景(跨文件重构、复杂调试、多步骤 feature 开发)。
- 如果你在做 AI 产品:关注定价变化。$50/百万输出 token 是目前 Claude 系列最贵的档位,需要重新算成本模型。
- 如果你在做安全相关工作:了解 Mythos 5 的可信访问计划,它可能是目前最强的 AI 网络安全工具。
Fable 5 和 Mythos 5 的联合发布,是 Anthropic 迄今最大胆的产品动作。它不只是发了个新模型,而是在"能力释放"和"安全控制"之间做了一个新的平衡实验。
这个实验的结果会直接影响接下来整个行业怎么处理前沿模型的发布策略。
你怎么看?5% 的请求被安全机制转走,你能接受吗?评论区聊聊。