GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!

当看到 GLM-5 正式发布后的能力,才惊觉前几天神秘模型 Pony Alpha 的热度还是有点保守了。

因为这一次,GLM-5 直接把开源 AI 也拽进了长任务时代

瞧,GLM-5 直接身兼数职,自己连续跑代码超过 24 小时,700 次工具调用、800 次上下文切换之后......

它直接用 JavaScript,从零手搓了一个 Game Boy Advance(GBA)模拟器!

外观渲染画面是这样的:

屏幕里是这样的:

在没有渲染情况下的动态效果如下:

视频详情

GLM-5 依旧是精准地捕捉到了 Prompt 中的关键词,生成的 HTML 文件打开后,一个光影交错的十二面体悬浮在空中。

除此之外,包括像全栈类型任务,例如制作一个完整、有设计感的电商网站,GLM-5 也是可以拿捏。

以及有人也用 GLM-5 手搓了个 3D 版可交互的**《我的世界》!**

开源,Win Again

GLM-5 的出现,不论是从实测还是网友们的反响来看,都在标志一件事情:

开源大模型完成了一次从助手到独立工程师的质变。

以前,我们用 AI 是写一句 Prompt,但需要不断地去做调试的工作;但现在,用 GLM-5 可以是给它一个目标,然后去喝咖啡,偶尔回来看看它有没有跑偏。

更宏观地来看,这对于 SaaS 行业来说,也可能是一场风暴。

毕竟就在前几天,随着 Claude Opus 等具备长任务能力的闭源模型展现威力,国外市场已经出现了恐慌。

例如当时金融数据服务商 FactSet 最惨盘中暴跌 10%,S&P Global、穆迪、纳斯达克公司纷纷下跌,各大指数全线跳水。

Fortune 和 CNBC 报道称,SaaS 软件类股票遭到抛售,投资者担心,如果 AI 能现场手搓一个 CRM 系统,谁还去买年费软件。

虽然黄仁勋安抚说 AI 会增强现有工具,但 GLM-5 的实测表现告诉我们:重塑或许已经在发生。

更重要的是,之前这种能力是闭源巨头的特权。现在,GLM-5 把这把钥匙交到了所有开发者手里。

或许这次开源模型 24 小时不间断自己跑代码只是一个起点,未来会更长、更快、更好、更强。

Two More Things:

GLM 其实从 4.5 版本开始就死磕 AI 编程这件事,现在这个国产 AI 的 coding 套餐在国内外也是相当火爆;这次智谱一上来就限售,外国网友们都是在 "求" 的状态。

以及,智谱公司的大楼,现在也是成了个打卡点

开头我们提到的 GBA 模拟器,由于 GLM-5 一直在跑,程序员小哥哥下班打车是这样的:Agent 乘客

GitHub:
github.com/zai-org/GLM...

Hugging Face:
huggingface.co/zai-org/GLM...

ModelScope:
modelscope.cn/models/Zhip...

GameBoy Advance 体验:
e01.ai/gba

欢迎在评论区留下你的想法!

--- ---

相关推荐
木雷坞8 分钟前
让 AI 编程助手跑得起项目:Dev Container 实践记录
人工智能
leeyi11 分钟前
MCP 工具集成:外部工具变 Eino Tool
aigc·agent·mcp
腾讯云开发者1 小时前
港科大郭毅可谈Agentic AI时代的核心命题:人机共生,人不可能退场
人工智能
常丛丛1 小时前
5.6 LangGraph-Edges理解-Agent图的道路系统
人工智能
雪隐1 小时前
个人电脑玩AI-08让5060 Ti给你打工——我拿 Unlimited-OCR扫了 600 页书,然后悟了
人工智能·后端
Coffeeee1 小时前
Prompt要花心思写,与 AI 对话的七个技巧
人工智能·aigc·ai编程
刘棕霆2 小时前
27—AI Skill 测评如何避免确认偏误:盲测对比与解盲分析
aigc·ai编程·测试
蝎子莱莱爱打怪2 小时前
Claude Code 官宣新升级:子智能体默认后台跑,你边聊它边干活
人工智能
武子康2 小时前
调查研究-206 DeepSeek DSpark 深度解析:大模型推理加速,正在从“模型能力”转向“系统工程”
人工智能·agent·deepseek