Marvis:腾讯悄悄搞了个 AI 桌面助手,有点意思
一个能直接操控你电脑文件、据说关机还能跑、自带云模型和多 Agent 协作的桌面 AI 工具,到底能做什么?
最近体验了一款叫 Marvis 的 AI 桌面助手,来自腾讯。在我看来,腾讯都是喜欢后发制人,然后占领高点。这一次推出的Marvis让我感觉不一样,就像他们认定了这个东西一定是个正确的方向,已经不再像以往那样左右观望了--在国内外还几乎没有类似的产品出来的情况下,直接就推出了Marvis。你还别说,上手之后有几个点确实让人眼前一亮,分享给关注 AI 工具链的同学。
直接访问本机文件和应用,真正的"桌面级"AI
很多 AI 工具都困在浏览器里------它们能聊、能搜、能生成代码,但碰不到你电脑上的真实文件。Marvis 不一样:它能直接访问本机文件系统和已安装的应用。
这意味着你可以对它说"帮我整理桌面上的发票,按月份分到对应文件夹",或者"把上周下载的那份合同转成 PDF 发给我"------它真的能动手去做,而不是告诉你"请手动操作以下步骤"。
对开发者来说,想象一下让它帮你批量处理项目中的配置文件、扫描代码仓库中的敏感信息,或者自动整理散落在各处的技术文档------这些都是本地文件操作的真实场景。
虽说这界面跟别的Agent不同了,但我还是不太明白区别,我直接问Marvis:你跟openclaw workbuddy 悟空 之类有什么区别呢?它这样回复:
Marvis 与这几个产品/框架的区别主要体现在定位和运行环境上:
| 维度 | Marvis | OpenClaw / WorkBuddy / 悟空 |
|---|---|---|
| 定位 | 桌面智能助手,深度绑定当前 Windows 环境,以本地文件、应用、系统操作为核心 | 多为通用 AI Agent 框架或 SDK,面向开发者构建自定义 Agent 应用 |
| 运行环境 | 运行在用户本地 Windows 电脑上,直接操作本地文件系统、桌面应用、Android 模拟器 | 通常是跨平台框架(Node.js/Python),跑在服务端或开发者本地,不绑定特定用户桌面 |
| 核心能力 | 文件管理、系统配置、Android App 操作、Windows 窗口管理、搜索总结------一切围绕"这台电脑" | 更偏向 Agent 编排、工具注册、多模型路由、协议适配等基础设施层能力 |
| 使用方式 | 自然语言直接对话,类 ChatGPT 的交互体验,开箱即用 | 需要开发者编写配置、注册工具、定义工作流,面向技术用户 |
| Sub Agent 体系 | 内置 File / App / Computer / Browser / Search 等专用子 Agent,按专业领域自动路由 | 一般由开发者自行定义 Agent 角色和能力 |
简单说:Marvis 是一个面向终端用户、开箱即用的桌面 AI 助手 ,直接帮你操作这台电脑上的文件、软件和系统;而 OpenClaw 这类是面向开发者的 Agent 构建框架,需要你自己搭积木。一个是成品工具,一个是造工具的零件。说白了就是如果你要让Workbuddy之类整理某个文件夹中文件之类的任务,你得让它写skill和脚本,而Marvis是直接干。
自带云模型,零配置开箱即用
用过本地模型的开发者都懂那种痛苦------下载几个 G 的模型文件、折腾 CUDA 版本、调参、担心显存不够。Marvis 做了一个非常"腾讯"的决定:自带云模型,用户无需配置。
打开即用,不需要填 API Key,不需要选模型版本,不需要纠结 token 计费,目前是每天送1000万token,这很顶了。
我就感觉,"这直接就是下一个微信啊"------话虽有点夸张,但逻辑是通的:微信当年靠"零门槛"取代了需要复杂配置的即时通讯工具,Marvis 也在用同样的策略降低 AI 桌面工具的使用门槛。对技术用户来说你可以继续折腾本地模型,但对普通用户和强调效率的开发者,零配置就是最大优势。
关机也能工作?(待确认)
⚠️ 本文标注:此功能为待确认状态,具体实现方式以官方最终说明为准。
这一点是最让我好奇的。用户反馈中提到 Marvis "据说关机也能工作",如果属实,意味着它可能具备某种常驻服务或云端协同机制------即使本地设备关机,后台任务仍可能通过云端的 Agent 实例继续执行。
从技术角度看,这可能会是一种"本地 Agent + 云端备份执行"的混合架构。如果真的落地,对于耗时较长的批量任务(比如大文件处理、定时任务、跨设备同步)会非常实用。但目前官方还未正式披露这一功能的细节,值得持续关注。
因为我是苹果手机,正好这个版本还在审核中,无法验证,我感觉是通过手机端控制云任务,然后开机同步的。
多 Agent + 协作机制,不是单打独斗
Marvis 不是"一个大模型干所有事",而是内置了多 Agent 架构及协作机制。这不算亮点,现在市面上各类Agent都有,基本已经是标配了。

这个办公室挺有意思,我记得openclaw是一只龙虾,这个Marvis搞了一个团队放这里,给我一种监控员工的老板视角,感觉还不错,原来看员工在摸鱼真的想捏他呢。这意味着不同类型的工作可以由专门的 Agent 承接------读文件有 File Agent、搜图片有 Image Search、整理文件有 File Organizer------这些 Agent 之间可以互相传递任务上下文、分阶段协作。比如"找到所有发票 → 识别发票信息 → 输出到 Excel"这样的多步骤任务,背后可能是三个 Agent 在接力完成。
对开发者来说,这种架构思路并不陌生------它很像微服务的设计哲学:单一职责、组合协作、故障隔离。区别于很多 AI 工具"一个 Chatbot 打天下"的做法,Marvis 的多 Agent 设计给复杂任务提供了更稳定的执行保障。
技能广场,AI 版的"应用商店"
Marvis 也提供了一个技能广场,用户可以按需安装各类扩展技能------文档写作、Excel 分析、PPT 生成、发票识别、图片搜索等等。

这块跟其他虾马没什么区别,但也不可或缺,已经是基础设施标配了。
小结
Marvis 目前给我的感觉是:腾讯在认真做一款"让 AI 真正进入桌面工作流"的产品,而不是又做了一个 ChatGPT 的壳。这就好比自动架驶,电脑就是车,Marvis就是大脑。目前是L2级别,比较安全可控的级别,我觉得这确实就是未来的趋势,腾讯终于支棱起来了!
如果你也在关注 AI 工具从"对话式"向"代理式"的演进,Marvis 值得放进你的待观察清单。