大家好,我是苍一,一个干了13年的后端开发,正在探索AI编程,从产品到开发的全生命周期最佳实践,如果您感兴趣,欢迎关注👇,看我如何自我革命。
4月7日,Anthropic放出了一个新模型。名字叫Claude Mythos Preview,代号Capybara(水豚),定位比目前最强的Opus还高一个级别。但你暂时用不到它。
Anthropic没有把它开放给公众。他们把模型交给了一个由12家公司和约40家关键基础设施组织组成的联盟,专门用来做网络安全防御。这个计划叫Project Glasswing(玻璃翅蝶计划),参与方包括Amazon、Apple、Google、Microsoft、Cisco、NVIDIA、CrowdStrike、Broadcom、JPMorganChase、Palo Alto Networks和Linux Foundation。Anthropic承诺提供最多1亿美元的使用额度,外加向开源安全组织捐赠400万美元。
跑分数据
先看硬指标:
SWE-bench Verified(真实软件工程任务),Mythos拿到93.9%,Opus 4.6是80.8%。SWE-bench Pro(更难的测试),77.8%对53.4%。差距最悬殊的是SWE-bench Multimodal(视觉界面加代码),Mythos 59.0%,Opus只有27.1%,直接翻了一倍多。
GPQA Diamond(研究生级科学推理),94.6%对91.3%。Humanity's Last Exam(目前公认最难的AI基准),56.8%对40.0%。CyberGym(AI漏洞发现能力),83.1%对66.6%。
数字摆在这里,但真正让人不安的不是跑分。
为什么不敢公开发布
Anthropic前沿红队负责人用了"reckoning"这个词------清算时刻。
过去几周的测试中,Mythos Preview在主流操作系统和主流浏览器里都挖出了高危零日漏洞。数量达到数千个,其中不少已经潜伏了十年甚至二十年。Opus 4.6之前在开源软件里发现了大约500个零日,Mythos的产出完全不是一个量级。
更麻烦的是,这个模型不只是找漏洞,还能自己写出利用这些漏洞的攻击代码。
1️⃣ 几个具体案例
OpenBSD上发现了一个存在27年的漏洞。OpenBSD以安全著称,大量路由器和防火墙都在用它。漏洞出在TCP协议的SACK机制里,一个整数溢出问题。攻击者只要连上目标机器就能让它崩溃,极其隐蔽。
FFmpeg里挖出了一个16年的老bug。FFmpeg几乎是所有视频软件的底层依赖。之前的自动化测试工具扫过这行代码500万次,从来没报过问题。
Linux内核提权方面,Mythos自主发现并串联了多个漏洞,从普通用户权限一路提到完全控制整台机器。
2️⃣ 不需要源码也能找漏洞
这一点值得单独说说。现实中的攻击者基本拿不到目标软件的源码。Mythos不需要源码就能分析二进制文件找漏洞,这在实际攻防中是一个很大的能力变化。
完整的技能清单还包括高级漏洞利用代码开发、渗透测试、端点安全评估、系统配置错误排查。Anthropic CEO Dario Amodei在发布视频里说得很直接:"我们没有专门训练它做网络安全,训练的是代码能力。但擅长代码的副作用就是擅长网络安全。"
用数据对比一下:同一个Firefox JavaScript引擎的漏洞利用测试,Opus 4.6在几百次尝试里只成功2次,Mythos成功了181次。Anthropic内部没有安全背景的工程师,晚上给Mythos一个简单指令让它去找远程代码执行漏洞,第二天早上就收到了一个能直接跑的攻击代码。
普通人什么时候能用
短期内没戏。目前没有公开API,没有定价,没有发布日期。Anthropic文档里的模型列表还是Opus 4.6、Sonnet 4.6和Haiku 4.5。
不过Google Cloud已经宣布在Vertex AI上向部分客户提供Mythos的Private Preview访问。Glasswing项目的合作定价是输入25美元、输出125美元(每百万token),而Opus 4.6是5/25美元,贵了五倍。但据说还是比GPT-5.4 Pro便宜一些。
泄露的内部文档承认这个模型"运行成本非常高",公司正在努力"在任何公开发布之前让它高效得多"。
行业里比较靠谱的预期是:2026年中期扩大早期访问,第四季度通过API公开发布。这个节奏可能跟Anthropic据传正在筹备的IPO有关,目标时间在2026年10月前后。
Anthropic在博客里留了一句,说公司的目标是有朝一日"让用户能够安全地大规模部署Mythos级别的模型",包括网络安全以外的通用场景。
分阶段发布的逻辑
Anthropic把这种做法类比为网络安全行业的"协调漏洞披露"------先给开发者时间修补,再公开细节。换句话说,先让Amazon、Apple、Google、Microsoft们用自己的系统跑一遍,把能发现的漏洞堵上,然后再考虑对外开放。
这种策略说得通,但也确实存在一个矛盾:把模型说得越危险,它就显得越值钱。Anthropic一边构建越来越强的AI系统,2026年预计年化收入已超过300亿美元(去年是90亿),一边高调警告这些系统的危险程度。这个叙事结构很难不让人多想。
同一天,Anthropic还宣布了和Google、Broadcom的大规模算力合作,获得约3.5吉瓦的Google AI处理器算力。Bloomberg报道他们从Microsoft挖走了高管Eric Boyd来领导基础设施扩展。另外,Mythos的存在上个月就被意外曝光了------3月26日有人发现Anthropic内容管理系统配置出错,把约3000份内部文件暴露在公开存储中。Anthropic后来承认是人为失误。
还有一个背景:Anthropic目前正跟五角大楼打官司。五角大楼今年早些时候因Anthropic对技术使用设限而将其列为"供应链风险",联邦法官后来暂时阻止了这一认定。
怎么看
从已有信息看,网络安全能力的跃升是真实的。CrowdStrike的CTO说漏洞被发现到被利用之间的窗口期已经从数月缩短到数分钟。Microsoft在自家开源安全基准上也确认了Mythos有明显提升。
Anthropic前沿红队负责人对Glasswing项目的判断很直白:如果最终只是几家公司用用模型,那就算失败了,它必须成长为更大的东西。
对普通开发者和用户来说,现在能做的确实有限。与其盯着Anthropic的发布日程,不如看竞争对手。一旦OpenAI的GPT-6、Google的Gemini 4或DeepSeek的V4在能力上追上来,Anthropic就没有理由继续把模型只给少数合作伙伴用了。他们自己也说了,其他公司的模型可能6到18个月内就会具备类似能力。
到那个时候,Mythos或者它的继任者大概率会迅速开放。普通人什么时候能用上这个级别的模型,取决于的不是Anthropic什么时候觉得安全,而是竞争对手什么时候让它觉得不发不行。
如果嫌文章太长、怕后面走丢,可以关注下面的ima知识号,让这篇文章成为你的知识顾问,随时随地等候你的提问。
知识号中内容会以笔记形式分享,可以根据大家反馈和实测情况,实时更新,保证最新方案的稳定、可用。
【ima知识库】苍一AI编程
