当看到 GLM-5 正式发布后的能力,才惊觉前几天神秘模型 Pony Alpha 的热度还是有点保守了。
因为这一次,GLM-5 直接把开源 AI 也拽进了长任务时代。
瞧,GLM-5 直接身兼数职,自己连续跑代码超过 24 小时,700 次工具调用、800 次上下文切换之后......
它直接用 JavaScript,从零手搓了一个 Game Boy Advance(GBA)模拟器!
外观渲染画面是这样的:

屏幕里是这样的:

在没有渲染情况下的动态效果如下:
GLM-5 依旧是精准地捕捉到了 Prompt 中的关键词,生成的 HTML 文件打开后,一个光影交错的十二面体悬浮在空中。
除此之外,包括像全栈类型任务,例如制作一个完整、有设计感的电商网站,GLM-5 也是可以拿捏。
以及有人也用 GLM-5 手搓了个 3D 版可交互的**《我的世界》!**

开源,Win Again
GLM-5 的出现,不论是从实测还是网友们的反响来看,都在标志一件事情:
开源大模型完成了一次从助手到独立工程师的质变。
以前,我们用 AI 是写一句 Prompt,但需要不断地去做调试的工作;但现在,用 GLM-5 可以是给它一个目标,然后去喝咖啡,偶尔回来看看它有没有跑偏。
更宏观地来看,这对于 SaaS 行业来说,也可能是一场风暴。
毕竟就在前几天,随着 Claude Opus 等具备长任务能力的闭源模型展现威力,国外市场已经出现了恐慌。
例如当时金融数据服务商 FactSet 最惨盘中暴跌 10%,S&P Global、穆迪、纳斯达克公司纷纷下跌,各大指数全线跳水。
Fortune 和 CNBC 报道称,SaaS 软件类股票遭到抛售,投资者担心,如果 AI 能现场手搓一个 CRM 系统,谁还去买年费软件。
虽然黄仁勋安抚说 AI 会增强现有工具,但 GLM-5 的实测表现告诉我们:重塑或许已经在发生。
更重要的是,之前这种能力是闭源巨头的特权。现在,GLM-5 把这把钥匙交到了所有开发者手里。
或许这次开源模型 24 小时不间断自己跑代码只是一个起点,未来会更长、更快、更好、更强。
Two More Things:
GLM 其实从 4.5 版本开始就死磕 AI 编程这件事,现在这个国产 AI 的 coding 套餐在国内外也是相当火爆;这次智谱一上来就限售,外国网友们都是在 "求" 的状态。
以及,智谱公司的大楼,现在也是成了个打卡点:

开头我们提到的 GBA 模拟器,由于 GLM-5 一直在跑,程序员小哥哥下班打车是这样的:Agent 乘客
。

GitHub:
github.com/zai-org/GLM...
Hugging Face:
huggingface.co/zai-org/GLM...
ModelScope:
modelscope.cn/models/Zhip...
GameBoy Advance 体验:
e01.ai/gba
欢迎在评论区留下你的想法!
--- 完 ---