今夜,智谱把“手机贾维斯”的源代码,扔到了GitHub上

2025年12月9日,科技圈发生了一件可能会被载入AI发展史的大事。

当大部分人还在讨论哪家的大模型写诗更押韵时,智谱AI默默干了一件事:他们把自家的核心AI Agent模型------AutoGLM,正式开源了。

这不仅仅是开源了一个模型,更像是把一把通往"真·智能手机"时代的钥匙,交到了每一个开发者,甚至是普通玩家手里。

真的能看懂屏幕的AI

先别急着划走,我们得搞清楚AutoGLM和Siri、小爱同学到底有什么区别。

传统的语音助手,本质上是在调用APP提供的接口。如果APP不开接口,助手就是个瞎子。但AutoGLM走的是一条完全拟人的路子:视觉理解

简单说,它像人眼一样"看"你的手机屏幕截图,用大模型分析界面上的按钮、文字、输入框在哪里,然后通过ADB指令模拟手指的点击和滑动。

这意味着什么?意味着它不需要微信给你开API,也能帮你回消息;不需要美团授权,也能帮你点外卖。

在智谱放出的演示里,这个9B参数量的模型(AutoGLM-Phone-9B),已经能熟练地在微信、淘宝、抖音、美团等50多个我们每天都在用的APP里"冲浪"。点外卖、订机票、发红包,这些需要跨应用、甚至长达几十步的操作,它都能自己搞定。

为什么说这是"掀桌子"?

在前段时间,字节跳动的"豆包手机助手"刚让大家见识了AI操作手机的威力。就在各大巨头准备筑起高墙、圈地自萌的时候,智谱反手就是一个开源。

这一招,直接把技术门槛拉到了地板上。

1. 每个人都能有自己的定制管家 开源意味着硬件厂商不用从头造轮子,华强北的开发者、甚至是你我这样懂点代码的极客,都可以基于AutoGLM,为自己的设备装上一个"大脑"。想做一个专门帮你抢演唱会门票的Agent?或者一个只在这个点帮你自动领游戏签到奖励的脚本?现在,底座有了。

2. 隐私狂魔的福音 这是开源最核心的杀手锏。很多人不敢用云端AI操作手机,怕隐私泄露。AutoGLM支持本地部署。只要你的设备跑得动,所有的数据处理、屏幕识别、操作指令,全部都在你本地完成,不需要上传任何一字节的敏感信息给云端服务器。你的手机,完全由你掌控。

32个月的磨剑

这个项目不是一时兴起。据透露,智谱团队从2023年4月就开始折腾这事儿了。

早期的版本很不稳定,像个刚学步的孩子,经常点错或者卡住。经过32个月的打磨,特别是AutoGLM 2.0版本,在数千个虚拟设备里进行了强化学习,现在的它已经具备了相当强悍的泛化能力。也就是说,哪怕APP更新了,界面微调了,它依然能认出"确认支付"的按钮在哪。

下一代手机的雏形

我们总在喊"AI手机"元年,但如果AI手机只是多了一个画图功能,那未免太无聊了。

真正的AI手机,应该是你对它说"帮我订张明天去上海的票,要靠窗",然后你就可以把手机扔一边去洗澡,出来时票已经出好了。AutoGLM的开源,正在把这个场景变成所有安卓设备的标配,而不再是某一款旗舰机的专属。

目前,项目代码已经托管在GitHub,模型权重也上了Hugging Face。虽然现在它可能还不够完美,偶尔也会犯傻,但开源社区的力量是恐怖的。也许下周,就会有大神魔改出更惊艳的版本。

对于开发者来说,这是风口;对于普通用户来说,那个像《钢铁侠》里贾维斯一样的管家,可能真的不远了。

最后提个醒: 虽然代码开源了,但在让AI帮你花钱或者发消息之前,记得把那个"关键操作需人工确认"的开关打开。毕竟,你也不想一觉醒来,发现AI帮你清空了购物车,对吧?

如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

相关推荐
墨风如雪9 小时前
告别延迟!通义开源Fun-Audio-Chat,这才是我们要的语音AI
aigc
小程故事多_8012 小时前
Spring AI 赋能 Java,Spring Boot 快速落地 LLM 的企业级解决方案
java·人工智能·spring·架构·aigc
da_vinci_x13 小时前
【2D场景】16:9秒变21:9?PS “液态缩放” + AI 补全,零成本适配全面屏
前端·人工智能·游戏·aigc·设计师·贴图·游戏美术
老吴学AI14 小时前
范式转移:生成式AI如何重新定义“智能应用
人工智能·aigc·agent
reddingtons15 小时前
【品牌包装】告别“贴图怪”!Firefly + Illustrator Mockup,0 建模一键“真”样机
人工智能·aigc·illustrator·传媒·设计师·贴图·样机
程序员X小鹿15 小时前
免费!豆包又上新功能,吊打付费软件!老罗现场演示!(附使用入口)
aigc
mys551817 小时前
杨建允:AI搜索优化对汽车服务行业获客的影响
人工智能·aigc·geo·ai搜索优化·ai引擎优化
迈火17 小时前
ComfyUI - ELLA:解锁ComfyUI图像生成新境界的神奇插件
人工智能·gpt·stable diffusion·aigc·音视频·midjourney·llama
用户51914958484520 小时前
深入解析Samba WINS命令注入漏洞(CVE-2025-10230) - 完整PoC实现
人工智能·aigc
沛沛老爹21 小时前
Web开发者实战A2A智能体交互协议:从Web API到AI Agent通信新范式
java·前端·人工智能·云原生·aigc·交互·发展趋势