GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!

当看到 GLM-5 正式发布后的能力,才惊觉前几天神秘模型 Pony Alpha 的热度还是有点保守了。

因为这一次,GLM-5 直接把开源 AI 也拽进了长任务时代

瞧,GLM-5 直接身兼数职,自己连续跑代码超过 24 小时,700 次工具调用、800 次上下文切换之后......

它直接用 JavaScript,从零手搓了一个 Game Boy Advance(GBA)模拟器!

外观渲染画面是这样的:

屏幕里是这样的:

在没有渲染情况下的动态效果如下:

视频详情

GLM-5 依旧是精准地捕捉到了 Prompt 中的关键词,生成的 HTML 文件打开后,一个光影交错的十二面体悬浮在空中。

除此之外,包括像全栈类型任务,例如制作一个完整、有设计感的电商网站,GLM-5 也是可以拿捏。

以及有人也用 GLM-5 手搓了个 3D 版可交互的**《我的世界》!**

开源,Win Again

GLM-5 的出现,不论是从实测还是网友们的反响来看,都在标志一件事情:

开源大模型完成了一次从助手到独立工程师的质变。

以前,我们用 AI 是写一句 Prompt,但需要不断地去做调试的工作;但现在,用 GLM-5 可以是给它一个目标,然后去喝咖啡,偶尔回来看看它有没有跑偏。

更宏观地来看,这对于 SaaS 行业来说,也可能是一场风暴。

毕竟就在前几天,随着 Claude Opus 等具备长任务能力的闭源模型展现威力,国外市场已经出现了恐慌。

例如当时金融数据服务商 FactSet 最惨盘中暴跌 10%,S&P Global、穆迪、纳斯达克公司纷纷下跌,各大指数全线跳水。

Fortune 和 CNBC 报道称,SaaS 软件类股票遭到抛售,投资者担心,如果 AI 能现场手搓一个 CRM 系统,谁还去买年费软件。

虽然黄仁勋安抚说 AI 会增强现有工具,但 GLM-5 的实测表现告诉我们:重塑或许已经在发生。

更重要的是,之前这种能力是闭源巨头的特权。现在,GLM-5 把这把钥匙交到了所有开发者手里。

或许这次开源模型 24 小时不间断自己跑代码只是一个起点,未来会更长、更快、更好、更强。

Two More Things:

GLM 其实从 4.5 版本开始就死磕 AI 编程这件事,现在这个国产 AI 的 coding 套餐在国内外也是相当火爆;这次智谱一上来就限售,外国网友们都是在 "求" 的状态。

以及,智谱公司的大楼,现在也是成了个打卡点

开头我们提到的 GBA 模拟器,由于 GLM-5 一直在跑,程序员小哥哥下班打车是这样的:Agent 乘客

GitHub:
github.com/zai-org/GLM...

Hugging Face:
huggingface.co/zai-org/GLM...

ModelScope:
modelscope.cn/models/Zhip...

GameBoy Advance 体验:
e01.ai/gba

欢迎在评论区留下你的想法!

--- ---

相关推荐
安吉升科技4 分钟前
ai双目智能客流摄像头是什么?有哪些作用呢?
人工智能
大势智慧12 分钟前
大势智慧与您相约2026世界无人机大会暨UASE无人机展
人工智能·无人机·趋势·未来·低空经济·空间智能·世界无人机大会
云烟成雨TD14 分钟前
Spring AI Alibaba 1.x 系列【52】Interrupts 中断机制:节点执行前后静态中断
java·人工智能·spring
染指111039 分钟前
3.AI大模型-token是什么-大模型底层运行机制
人工智能·算法·机器学习
stsdddd39 分钟前
【YOLO算法多类别野生动物识别目标检测数据集】
人工智能·yolo·目标检测
qq_4112624243 分钟前
四博AI眼罩方案升级:白噪音、音乐助眠、AI情绪陪伴,把智能音箱戴在身
人工智能·智能音箱
han_1 小时前
AI Skill 是什么?一篇讲清楚它和 Prompt、MCP 的区别
人工智能·ai编程·mcp
实习僧企业版1 小时前
从“抢人”到“识人”,回归匹配本质
大数据·人工智能·雇主品牌·招聘技巧
杰建云1671 小时前
多商家入驻小程序平台怎么做
人工智能·小程序
易观Analysys1 小时前
Agent生态中出现五大黄金创业赛道——《重构与崛起—OpenClaw时代的中国Agent产业生态报告》解读二
人工智能