今夜，智谱把“手机贾维斯”的源代码，扔到了GitHub上

2025年12月9日，科技圈发生了一件可能会被载入AI发展史的大事。

当大部分人还在讨论哪家的大模型写诗更押韵时，智谱AI默默干了一件事：他们把自家的核心AI Agent模型------AutoGLM，正式开源了。

这不仅仅是开源了一个模型，更像是把一把通往"真·智能手机"时代的钥匙，交到了每一个开发者，甚至是普通玩家手里。

先别急着划走，我们得搞清楚AutoGLM和Siri、小爱同学到底有什么区别。

传统的语音助手，本质上是在调用APP提供的接口。如果APP不开接口，助手就是个瞎子。但AutoGLM走的是一条完全拟人的路子：视觉理解。

简单说，它像人眼一样"看"你的手机屏幕截图，用大模型分析界面上的按钮、文字、输入框在哪里，然后通过ADB指令模拟手指的点击和滑动。

这意味着什么？意味着它不需要微信给你开API，也能帮你回消息；不需要美团授权，也能帮你点外卖。

在智谱放出的演示里，这个9B参数量的模型（AutoGLM-Phone-9B），已经能熟练地在微信、淘宝、抖音、美团等50多个我们每天都在用的APP里"冲浪"。点外卖、订机票、发红包，这些需要跨应用、甚至长达几十步的操作，它都能自己搞定。

在前段时间，字节跳动的"豆包手机助手"刚让大家见识了AI操作手机的威力。就在各大巨头准备筑起高墙、圈地自萌的时候，智谱反手就是一个开源。

这一招，直接把技术门槛拉到了地板上。

1. 每个人都能有自己的定制管家 开源意味着硬件厂商不用从头造轮子，华强北的开发者、甚至是你我这样懂点代码的极客，都可以基于AutoGLM，为自己的设备装上一个"大脑"。想做一个专门帮你抢演唱会门票的Agent？或者一个只在这个点帮你自动领游戏签到奖励的脚本？现在，底座有了。

2. 隐私狂魔的福音 这是开源最核心的杀手锏。很多人不敢用云端AI操作手机，怕隐私泄露。AutoGLM支持本地部署。只要你的设备跑得动，所有的数据处理、屏幕识别、操作指令，全部都在你本地完成，不需要上传任何一字节的敏感信息给云端服务器。你的手机，完全由你掌控。

这个项目不是一时兴起。据透露，智谱团队从2023年4月就开始折腾这事儿了。

早期的版本很不稳定，像个刚学步的孩子，经常点错或者卡住。经过32个月的打磨，特别是AutoGLM 2.0版本，在数千个虚拟设备里进行了强化学习，现在的它已经具备了相当强悍的泛化能力。也就是说，哪怕APP更新了，界面微调了，它依然能认出"确认支付"的按钮在哪。

我们总在喊"AI手机"元年，但如果AI手机只是多了一个画图功能，那未免太无聊了。

真正的AI手机，应该是你对它说"帮我订张明天去上海的票，要靠窗"，然后你就可以把手机扔一边去洗澡，出来时票已经出好了。AutoGLM的开源，正在把这个场景变成所有安卓设备的标配，而不再是某一款旗舰机的专属。

目前，项目代码已经托管在GitHub，模型权重也上了Hugging Face。虽然现在它可能还不够完美，偶尔也会犯傻，但开源社区的力量是恐怖的。也许下周，就会有大神魔改出更惊艳的版本。

对于开发者来说，这是风口；对于普通用户来说，那个像《钢铁侠》里贾维斯一样的管家，可能真的不远了。

最后提个醒： 虽然代码开源了，但在让AI帮你花钱或者发消息之前，记得把那个"关键操作需人工确认"的开关打开。毕竟，你也不想一觉醒来，发现AI帮你清空了购物车，对吧？

如果你也对最新的AI信息感兴趣或者有疑问都可以加入我的大家庭第一时间分享最新AI资讯、工具、教程、文档欢迎你的加入！！！😉😉😉

公众号：墨风如雪小站