那个霸榜的Pony Alpha现身了:智谱GLM-5硬刚Claude Opus

还记得前段时间在OpenRouter榜单上那个神秘兮兮、一度登顶热度榜的"Pony Alpha"吗?当时圈子里都在猜是哪家巨头又憋了个大招,是OpenAI的暗桩?还是Anthropic的新马甲?

2026年2月12日,谜底揭晓。不是硅谷的科技新贵,而是来自北京海淀的智谱AI。

这不仅仅是一次简单的版本号更迭。GLM-5的发布,实际上宣告了国产大模型从"能聊天"正式跨越到了"能干活"的工程化阶段。我看完了智谱长达几十页的技术报告和Github上的代码库,剔除掉那些公关辞令,这就带大家看看这台名为GLM-5的机器到底成色几何。

参数怪兽与"瘦身"哲学

先看最吓人的数字:744B。

是的,GLM-5的总参数量高达7440亿。这是什么概念?上一代GLM-4.5才355B,直接翻了一倍多。但别被这个数字劝退,这里面藏着智谱的技术鸡贼(褒义):它采用了MoE(混合专家)架构,虽然块头大,但真正跑起来的"激活参数"只有40B。

这意味着什么?意味着它拥有巨型模型的知识储备,跑起来却只有中型模型的能耗。而且,智谱这次非常务实地集成了DeepSeek的Sparse Attention(稀疏注意力机制)。这个技术动作很关键,它解决了长文本"吞金兽"的问题,让200K的上下文窗口不再是摆设,而是真正用得起的生产力工具。

至于预训练数据,28.5T tokens。比前代涨了24%。在这个数据枯竭的年代,还能榨出这么多高质量token,本身就是护城河。

真的能写代码吗?

程序员最关心的Coding能力,这次GLM-5是奔着"砸场子"去的。

在SWE-bench-Verified这个目前公认最硬核的编程测试里,GLM-5拿下了77.8分。

为了让大家有个直观概念:Google的Gemini 3 Pro被它甩在身后,而目前公认的"代码之神"Claude Opus 4.5,分数在80分左右。也就是说,GLM-5已经无限逼近了目前人类AI编程的天花板。它不再是那个只能写写冒泡排序的玩具,而是能直接修补GitHub真实Issue的工程师。

智谱甚至搞了个"Z Code"智能体环境,你只需要动动嘴皮子提需求,它能在后台并发调度多个Agent,自己写代码、自己跑终端、自己Debug,最后把成品端上来。这才是我们想要的"AI编程",而不是给AI当纠错员。

像人类一样做长期规划

如果说写代码是硬功夫,那"经营模拟"就是考智商了。

在Vending Bench 2(自动售货机经营模拟)测试中,GLM-5操作了一年的虚拟生意,最终账户余额4432美元。作为对比,Claude Opus 4.5是4967美元。

这个测试考的不是算术,而是长程规划、资源管理和策略调整。大多数模型在这个测试里撑不过一个月就会破产,但GLM-5不仅活下来了,还赚了钱。这证明了它具备了处理复杂长链路任务的"Agent(智能体)"能力,这才是通往AGI的门票。

国产算力的全家桶

这一点必须单拎出来说。GLM-5是在纯国产算力上跑出来的。

官方名单列了一串:华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光。一共7家。这不只是"适配"那么简单,是在深度推理层面做到了高吞吐和低延迟。

这意味着,即使在算力封锁的背景下,国内企业依然能用上世界第一梯队能力的模型,而且不用担心哪天被断供。这可能是GLM-5不仅对于开发者,对于整个产业界最大的安全感来源。

写在最后

现在的开源社区已经很久没有这么让人兴奋的大家伙了。MIT协议开源,权重直接扔在Hugging Face和魔搭社区,这种"掀桌子"的打法,无疑会给闭源模型厂商带来巨大的压力。

当你发现一个免费开源的模型,在写代码和做复杂任务上已经能和月费20美元的顶流闭源模型打得有来有回时,选择其实已经很简单了。

GLM-5或许还不是完美的AGI,但它绝对是目前也是你可以免费下载到的、最接近那个未来的工具。

如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

相关推荐
MobotStone8 小时前
AI项目越多,为什么越容易失控
人工智能·aigc
刘棕霆10 小时前
19—MD5 缓存让测评系统学会了推断,而不是询问
aigc·测试
ZJPRENO12 小时前
成本直降 80%!豆包 2.1 Pro 问世,海外高端模型性价比优势全无
aigc
ServBay1 天前
如何利用本地技术栈构建 0 成本 AI SaaS 雏形
后端·aigc·ai编程
RainmeoX1 天前
Gemma 4 情绪分类微调实录:AMD ROCm 单卡 + LoRA 全流程
aigc
leeyi1 天前
Deer-Go:字节 Deer-Flow 的 Go 移植,深度研究 Agent 全拆解
go·aigc·agent
threerocks2 天前
AI编程的商业模式已经在互联网大厂跑通了
程序员·aigc·ai编程
怕浪猫2 天前
第3章 记忆系统:构建Agent的长期与短期记忆
aigc·openai·ai编程
DigitalOcean2 天前
AI 推理采用本地 + Serverless 混合架构:让敏感数据不出户,算力成本更低
aigc·agent
leeyi2 天前
Manus Agent:一个全能 AI,和一支研究团队
后端·aigc·agent