2025年12月9日,科技圈发生了一件可能会被载入AI发展史的大事。
当大部分人还在讨论哪家的大模型写诗更押韵时,智谱AI默默干了一件事:他们把自家的核心AI Agent模型------AutoGLM,正式开源了。
这不仅仅是开源了一个模型,更像是把一把通往"真·智能手机"时代的钥匙,交到了每一个开发者,甚至是普通玩家手里。

真的能看懂屏幕的AI
先别急着划走,我们得搞清楚AutoGLM和Siri、小爱同学到底有什么区别。
传统的语音助手,本质上是在调用APP提供的接口。如果APP不开接口,助手就是个瞎子。但AutoGLM走的是一条完全拟人的路子:视觉理解。
简单说,它像人眼一样"看"你的手机屏幕截图,用大模型分析界面上的按钮、文字、输入框在哪里,然后通过ADB指令模拟手指的点击和滑动。
这意味着什么?意味着它不需要微信给你开API,也能帮你回消息;不需要美团授权,也能帮你点外卖。
在智谱放出的演示里,这个9B参数量的模型(AutoGLM-Phone-9B),已经能熟练地在微信、淘宝、抖音、美团等50多个我们每天都在用的APP里"冲浪"。点外卖、订机票、发红包,这些需要跨应用、甚至长达几十步的操作,它都能自己搞定。

为什么说这是"掀桌子"?
在前段时间,字节跳动的"豆包手机助手"刚让大家见识了AI操作手机的威力。就在各大巨头准备筑起高墙、圈地自萌的时候,智谱反手就是一个开源。
这一招,直接把技术门槛拉到了地板上。
1. 每个人都能有自己的定制管家 开源意味着硬件厂商不用从头造轮子,华强北的开发者、甚至是你我这样懂点代码的极客,都可以基于AutoGLM,为自己的设备装上一个"大脑"。想做一个专门帮你抢演唱会门票的Agent?或者一个只在这个点帮你自动领游戏签到奖励的脚本?现在,底座有了。
2. 隐私狂魔的福音 这是开源最核心的杀手锏。很多人不敢用云端AI操作手机,怕隐私泄露。AutoGLM支持本地部署。只要你的设备跑得动,所有的数据处理、屏幕识别、操作指令,全部都在你本地完成,不需要上传任何一字节的敏感信息给云端服务器。你的手机,完全由你掌控。

32个月的磨剑
这个项目不是一时兴起。据透露,智谱团队从2023年4月就开始折腾这事儿了。
早期的版本很不稳定,像个刚学步的孩子,经常点错或者卡住。经过32个月的打磨,特别是AutoGLM 2.0版本,在数千个虚拟设备里进行了强化学习,现在的它已经具备了相当强悍的泛化能力。也就是说,哪怕APP更新了,界面微调了,它依然能认出"确认支付"的按钮在哪。
下一代手机的雏形
我们总在喊"AI手机"元年,但如果AI手机只是多了一个画图功能,那未免太无聊了。
真正的AI手机,应该是你对它说"帮我订张明天去上海的票,要靠窗",然后你就可以把手机扔一边去洗澡,出来时票已经出好了。AutoGLM的开源,正在把这个场景变成所有安卓设备的标配,而不再是某一款旗舰机的专属。
目前,项目代码已经托管在GitHub,模型权重也上了Hugging Face。虽然现在它可能还不够完美,偶尔也会犯傻,但开源社区的力量是恐怖的。也许下周,就会有大神魔改出更惊艳的版本。
对于开发者来说,这是风口;对于普通用户来说,那个像《钢铁侠》里贾维斯一样的管家,可能真的不远了。

最后提个醒: 虽然代码开源了,但在让AI帮你花钱或者发消息之前,记得把那个"关键操作需人工确认"的开关打开。毕竟,你也不想一觉醒来,发现AI帮你清空了购物车,对吧?
如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉
公众号:墨风如雪小站