我超!Claude Fable真来了,比Mythos还强?!

今天必须用"卧槽"开头,因为这是一个断代领先同行的模型而且并没有想象中的贵! 程序员和知识工作者的工作性质要发生巨变了!

这次发布的模型不叫"神话 Mythos",而是"寓言 Fable"!

未来世界的神话,先从寓言开始!

这个事情,接下来是必然刷屏的。我们先一起来看看一手的官方消息。 Claude系列终于跨入了5.0时代。

Claude 是Anthropic旗下的大模型系列产品。

Claude 官方的这条推文里就两句话:

介绍 Claude Fable 5:一款神话级模型,我们已将其安全化以供一般使用。

其能力超越了我们以往任何公开可用模型。

第一句,说明新模型叫 Claude Fable 5,属于 Mythos 级别的模型,加了一个保护栏。

第二句,能力超过 Claude 以往的所有模型,其实这个前缀可以拿掉,是超过全球所有模型!

为什么这么说?请看第二条推特:

Fable 5 在几乎所有测试基准上处于最先进水平,在软件工程、知识工作、科学研究和视觉领域表现出色。 任务越长且越复杂,Fable 5 相对于我们其他模型的优势就越大。

同时配了下面这张基准图片:

卧槽,看到这张图片真的是头皮发麻。奥特曼看了都瘫坐在沙发上,就像原子弹爆炸了。

这次一点都不夸张!

我们就看第一项"智能体编程"中的SWE-Bench Pro基准。

"寓言" Fable 5 的分数是 80.3%,而预览版的"神话" Mythos 5 是 77.8%。

也就是说今天发布的寓言,比之前发布的神话还要猛。

在这个指标上:

Claude Opus 4.8 只有 69.2%

GPT5.5 只有 58.6%,

Gemini 3.1 Pro 只有 54.2%!

要知道编程是一件难度非常高的事情,Pro基准也是一个难度非常高的基准。在专业的基准中,居然能断代领先前代和同行。

这是何等恐怖的存在!

智能体编程的第二项 FrontierCode,也是翻倍领先前代和 GPT5.5!

FrontierCode 是 Cognition 新出的代码智能体基准,重点不是测"代码能不能跑通",而是测:AI 写出来的代码,真实开源项目维护者会不会愿意合并。它比 SWE-bench 更偏"真实 PR 质量"。

智能体编程的 第三项基准 Terminal-Bench 2.1 ,现在也是第一名了,超过了之前的GPT5.5 。

当然除了编程之外,知识工作,电脑使用,跨学科推理 也全部是第一名!

如果你看不懂哪些数据和专业名词,只要记住一句话:在编程这个领域,Claude 无敌!在其他领域也遥遥领先

这一点,和我平时使用的体感是一模一样的。不要信什么坊间传说的鬼怪故事说,GPT5.5 比 Opus4.8 好用。

因为太强了,以至于必须加围栏! 我认为这并不是宣传手段,而是真的有风险。

接下来看第三条推特:

Claude 表示:

发布如此强大的模型会带来风险。

如果没有防护措施,Fable 5 在网络安全等领域的强大能力可能会被滥用,从而造成严重损害。

针对狭窄主题范围的查询将改为由我们下一个最强大的模型 Opus 4.8 进行响应。

我的理解是,网络安全等特殊领域会自动转给 Opus4.8 来处理!

也就是说,Fable 一看你要搞破坏,就把任务派给小弟 Opus4.8 来劝你做个好人。

除此之外,可能还会给你黄牌警告⚠️:

寓言 5 的防护措施能够检测与网络安全、生物学和化学以及蒸馏相关的内容。每当触发备用机制时,用户都会收到通知------平均而言,在不到 5% 的会话中发生。

另外,那个无比强大的 Mythos 5 正版,只会小范围提供给网络防御者和关键基础服务提供商。

这里可以明确一点:Mythos 5 与 Fable 5 共享相同的底层模型,但某些领域的防护措施已被解除。

最后一条信息是:

Claude Fable 5 今天已在全球范围内可用。

Claude Mythos 5 目前仅限 Glasswing 合作伙伴使用,直到我们扩展可信访问计划。

也就是说,所有 Claude Pro+ 的用户都可以立马用上 Fable 5模型了。

实测也确实可以使用了:

打开Claude.ai就会弹出一个窗口。

弹窗中给了两个信息,一个是我的套餐可以使用,消耗x2。

另一个是强调,有些消息触发了风控,就会转给其他模型。

这里面最重要的一个信息是"价格":

从提示中可以看到:配额消耗是 Opus 的两倍

也就是,价格大概是 Opus 两倍。单看这个已经很贵了,但是比我预期中的便宜很多。

坊间盛传是要 150 美金的输出价格,实际上只要 50 美金!

这一点,可以通过 Claude 官方给我发的邮件确认:

输入价格为 10 美金 / 百万 Tokens,输出价格为 50 美金 / 百万 Tokens。

基于如此强大的基准数据,这个价格真的是一点都不贵!

这个价格和 Claude Opus4.8 Fast 是一样的。

比 GPT5.5 Pro 便宜很多。GPT5.5 Pro 是输入 30,输出30,输出 30,输出180!

这么一看,我感觉我的 Pro 账号也能聊几句了,哈哈哈!

Fable 的最新消息基本在这里了。

从上面的基准和价格来看,我都觉得"价廉物美"啊!对于追求最强的人来说,这个模型绝对物超所值。

而且我觉得,程序员这个职业真的是要被完全重构了,它不在是一个执行者,而是控制者!

其他职业也会发生天翻地覆的变化 。

Anthropic 没有给我一毛钱,我还是要这么说的!

因为真的强!它们家的基准是比较靠谱的。

接下来,我会实测一波。你们说要不要找几个国产模型做参考,还是单测就好!

相关推荐
眠りたいです1 小时前
LangChainv1:agent快速上手与中间件认识
人工智能·python·中间件·langchain·langgraph
JJJennie7771 小时前
从苹果 2026 落地场景,看系统级 Agent 时代的隐私边界与 MAI Gateway 的企业Token治理
人工智能·gateway·apple
三叶草4351 小时前
Claude Code 接入 DeepSeek强强联合
人工智能
AI程序员1 小时前
Loop Engineering:你不再 prompt agent,而是设计 prompt agent 的系统
人工智能
咖啡星人k1 小时前
从 Vibe Coding 到专业开发:MonkeyCode 如何重新定义AI编程工作流
人工智能·ai编程·monkeycode
智慧景区与市集主理人1 小时前
巨有科技智慧营销平台|精准破局,解锁景区低成本高效增长模式
大数据·人工智能·科技
FrameNotWork1 小时前
HarmonyOS6.1 图像分类应用完整实战:从模型到界面
人工智能·分类·数据挖掘·harmonyos
MicrosoftReactor2 小时前
技术速递|以 Token 经济学驱动的架构:混合模型、AI Runway、AKS Kata MicroVM 与 MCP
人工智能·ai·架构·copilot·mcp
用户276247978502 小时前
Agent demo 跑通了,然后呢?聊聊多用户生产化这道没人填的坑
人工智能