GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!

当看到 GLM-5 正式发布后的能力,才惊觉前几天神秘模型 Pony Alpha 的热度还是有点保守了。

因为这一次,GLM-5 直接把开源 AI 也拽进了长任务时代

瞧,GLM-5 直接身兼数职,自己连续跑代码超过 24 小时,700 次工具调用、800 次上下文切换之后......

它直接用 JavaScript,从零手搓了一个 Game Boy Advance(GBA)模拟器!

外观渲染画面是这样的:

屏幕里是这样的:

在没有渲染情况下的动态效果如下:

视频详情

GLM-5 依旧是精准地捕捉到了 Prompt 中的关键词,生成的 HTML 文件打开后,一个光影交错的十二面体悬浮在空中。

除此之外,包括像全栈类型任务,例如制作一个完整、有设计感的电商网站,GLM-5 也是可以拿捏。

以及有人也用 GLM-5 手搓了个 3D 版可交互的**《我的世界》!**

开源,Win Again

GLM-5 的出现,不论是从实测还是网友们的反响来看,都在标志一件事情:

开源大模型完成了一次从助手到独立工程师的质变。

以前,我们用 AI 是写一句 Prompt,但需要不断地去做调试的工作;但现在,用 GLM-5 可以是给它一个目标,然后去喝咖啡,偶尔回来看看它有没有跑偏。

更宏观地来看,这对于 SaaS 行业来说,也可能是一场风暴。

毕竟就在前几天,随着 Claude Opus 等具备长任务能力的闭源模型展现威力,国外市场已经出现了恐慌。

例如当时金融数据服务商 FactSet 最惨盘中暴跌 10%,S&P Global、穆迪、纳斯达克公司纷纷下跌,各大指数全线跳水。

Fortune 和 CNBC 报道称,SaaS 软件类股票遭到抛售,投资者担心,如果 AI 能现场手搓一个 CRM 系统,谁还去买年费软件。

虽然黄仁勋安抚说 AI 会增强现有工具,但 GLM-5 的实测表现告诉我们:重塑或许已经在发生。

更重要的是,之前这种能力是闭源巨头的特权。现在,GLM-5 把这把钥匙交到了所有开发者手里。

或许这次开源模型 24 小时不间断自己跑代码只是一个起点,未来会更长、更快、更好、更强。

Two More Things:

GLM 其实从 4.5 版本开始就死磕 AI 编程这件事,现在这个国产 AI 的 coding 套餐在国内外也是相当火爆;这次智谱一上来就限售,外国网友们都是在 "求" 的状态。

以及,智谱公司的大楼,现在也是成了个打卡点

开头我们提到的 GBA 模拟器,由于 GLM-5 一直在跑,程序员小哥哥下班打车是这样的:Agent 乘客

GitHub:
github.com/zai-org/GLM...

Hugging Face:
huggingface.co/zai-org/GLM...

ModelScope:
modelscope.cn/models/Zhip...

GameBoy Advance 体验:
e01.ai/gba

欢迎在评论区留下你的想法!

--- ---

相关推荐
热点速递7 小时前
美团2025年“翻车”实录:从盈利王者到赤字领跑!
人工智能·业界资讯
ai产品老杨7 小时前
异构计算时代的架构突围:基于 Docker 的 AI 视频平台如何实现 X86/ARM 与 GPU/NPU 全兼容(源码交付)
人工智能·docker·架构
beyond阿亮7 小时前
OpenClaw在Windows上接入飞书完整指南
人工智能·windows·ai·openclaw
ybdesire7 小时前
通过训练代码来理解DLLM扩散语言模型
人工智能·语言模型·自然语言处理
多年小白7 小时前
Anthropic发布Mythos模型:为什么网络安全板块先跌为敬
网络·人工智能·科技·ai编程
爱丽_7 小时前
多因素最优解到梯度下降:AI 训练的数学主线
人工智能
网络工程小王7 小时前
【Python数据分析基础】
大数据·数据库·人工智能·学习
skilllite作者7 小时前
开源项目推荐SkillLite,项目取得阶段性成果总结
人工智能
二十雨辰7 小时前
[RAG]-智能体开发
人工智能·ai
第七页独白7 小时前
全星研发项目管理 APQP 软件系统:驱动高端制造研发数智化升级
人工智能