今天必须用"卧槽"开头,因为这是一个断代领先同行的模型 ,而且并没有想象中的贵! 程序员和知识工作者的工作性质要发生巨变了!
这次发布的模型不叫"神话 Mythos",而是"寓言 Fable"!
未来世界的神话,先从寓言开始!
这个事情,接下来是必然刷屏的。我们先一起来看看一手的官方消息。 Claude系列终于跨入了5.0时代。

Claude 是Anthropic旗下的大模型系列产品。
Claude 官方的这条推文里就两句话:
介绍 Claude Fable 5:一款神话级模型,我们已将其安全化以供一般使用。
其能力超越了我们以往任何公开可用模型。
第一句,说明新模型叫 Claude Fable 5,属于 Mythos 级别的模型,加了一个保护栏。
第二句,能力超过 Claude 以往的所有模型,其实这个前缀可以拿掉,是超过全球所有模型!
为什么这么说?请看第二条推特:
Fable 5 在几乎所有测试基准上处于最先进水平,在软件工程、知识工作、科学研究和视觉领域表现出色。 任务越长且越复杂,Fable 5 相对于我们其他模型的优势就越大。
同时配了下面这张基准图片:

卧槽,看到这张图片真的是头皮发麻。奥特曼看了都瘫坐在沙发上,就像原子弹爆炸了。
这次一点都不夸张!
我们就看第一项"智能体编程"中的SWE-Bench Pro基准。
"寓言" Fable 5 的分数是 80.3%,而预览版的"神话" Mythos 5 是 77.8%。
也就是说今天发布的寓言,比之前发布的神话还要猛。
在这个指标上:
Claude Opus 4.8 只有 69.2%
GPT5.5 只有 58.6%,
Gemini 3.1 Pro 只有 54.2%!
要知道编程是一件难度非常高的事情,Pro基准也是一个难度非常高的基准。在专业的基准中,居然能断代领先前代和同行。
这是何等恐怖的存在!
智能体编程的第二项 FrontierCode,也是翻倍领先前代和 GPT5.5!
FrontierCode 是 Cognition 新出的代码智能体基准,重点不是测"代码能不能跑通",而是测:AI 写出来的代码,真实开源项目维护者会不会愿意合并。它比 SWE-bench 更偏"真实 PR 质量"。
智能体编程的 第三项基准 Terminal-Bench 2.1 ,现在也是第一名了,超过了之前的GPT5.5 。
当然除了编程之外,知识工作,电脑使用,跨学科推理 也全部是第一名!
如果你看不懂哪些数据和专业名词,只要记住一句话:在编程这个领域,Claude 无敌!在其他领域也遥遥领先
这一点,和我平时使用的体感是一模一样的。不要信什么坊间传说的鬼怪故事说,GPT5.5 比 Opus4.8 好用。
因为太强了,以至于必须加围栏! 我认为这并不是宣传手段,而是真的有风险。
接下来看第三条推特:

Claude 表示:
发布如此强大的模型会带来风险。
如果没有防护措施,Fable 5 在网络安全等领域的强大能力可能会被滥用,从而造成严重损害。
针对狭窄主题范围的查询将改为由我们下一个最强大的模型 Opus 4.8 进行响应。
我的理解是,网络安全等特殊领域会自动转给 Opus4.8 来处理!
也就是说,Fable 一看你要搞破坏,就把任务派给小弟 Opus4.8 来劝你做个好人。
除此之外,可能还会给你黄牌警告⚠️:
寓言 5 的防护措施能够检测与网络安全、生物学和化学以及蒸馏相关的内容。每当触发备用机制时,用户都会收到通知------平均而言,在不到 5% 的会话中发生。
另外,那个无比强大的 Mythos 5 正版,只会小范围提供给网络防御者和关键基础服务提供商。
这里可以明确一点:Mythos 5 与 Fable 5 共享相同的底层模型,但某些领域的防护措施已被解除。
最后一条信息是:
Claude Fable 5 今天已在全球范围内可用。
Claude Mythos 5 目前仅限 Glasswing 合作伙伴使用,直到我们扩展可信访问计划。
也就是说,所有 Claude Pro+ 的用户都可以立马用上 Fable 5模型了。
实测也确实可以使用了:

打开Claude.ai就会弹出一个窗口。
弹窗中给了两个信息,一个是我的套餐可以使用,消耗x2。
另一个是强调,有些消息触发了风控,就会转给其他模型。
这里面最重要的一个信息是"价格":

从提示中可以看到:配额消耗是 Opus 的两倍!
也就是,价格大概是 Opus 两倍。单看这个已经很贵了,但是比我预期中的便宜很多。
坊间盛传是要 150 美金的输出价格,实际上只要 50 美金!
这一点,可以通过 Claude 官方给我发的邮件确认:

输入价格为 10 美金 / 百万 Tokens,输出价格为 50 美金 / 百万 Tokens。
基于如此强大的基准数据,这个价格真的是一点都不贵!
这个价格和 Claude Opus4.8 Fast 是一样的。
比 GPT5.5 Pro 便宜很多。GPT5.5 Pro 是输入 30,输出180!
这么一看,我感觉我的 Pro 账号也能聊几句了,哈哈哈!
Fable 的最新消息基本在这里了。
从上面的基准和价格来看,我都觉得"价廉物美"啊!对于追求最强的人来说,这个模型绝对物超所值。
而且我觉得,程序员这个职业真的是要被完全重构了,它不在是一个执行者,而是控制者!
其他职业也会发生天翻地覆的变化 。
Anthropic 没有给我一毛钱,我还是要这么说的!
因为真的强!它们家的基准是比较靠谱的。
接下来,我会实测一波。你们说要不要找几个国产模型做参考,还是单测就好!