Marvis：腾讯悄悄搞了个 AI 桌面助手，有点意思

一个能直接操控你电脑文件、据说关机还能跑、自带云模型和多 Agent 协作的桌面 AI 工具，到底能做什么？

最近体验了一款叫 Marvis 的 AI 桌面助手，来自腾讯。在我看来，腾讯都是喜欢后发制人，然后占领高点。这一次推出的Marvis让我感觉不一样，就像他们认定了这个东西一定是个正确的方向，已经不再像以往那样左右观望了--在国内外还几乎没有类似的产品出来的情况下，直接就推出了Marvis。你还别说，上手之后有几个点确实让人眼前一亮，分享给关注 AI 工具链的同学。

直接访问本机文件和应用，真正的"桌面级"AI

很多 AI 工具都困在浏览器里------它们能聊、能搜、能生成代码，但碰不到你电脑上的真实文件。Marvis 不一样：它能直接访问本机文件系统和已安装的应用。

这意味着你可以对它说"帮我整理桌面上的发票，按月份分到对应文件夹"，或者"把上周下载的那份合同转成 PDF 发给我"------它真的能动手去做，而不是告诉你"请手动操作以下步骤"。

对开发者来说，想象一下让它帮你批量处理项目中的配置文件、扫描代码仓库中的敏感信息，或者自动整理散落在各处的技术文档------这些都是本地文件操作的真实场景。

虽说这界面跟别的Agent不同了，但我还是不太明白区别，我直接问Marvis：你跟openclaw workbuddy 悟空之类有什么区别呢？它这样回复：

Marvis 与这几个产品/框架的区别主要体现在定位和运行环境上：

维度	Marvis	OpenClaw / WorkBuddy / 悟空
定位	桌面智能助手，深度绑定当前 Windows 环境，以本地文件、应用、系统操作为核心	多为通用 AI Agent 框架或 SDK，面向开发者构建自定义 Agent 应用
运行环境	运行在用户本地 Windows 电脑上，直接操作本地文件系统、桌面应用、Android 模拟器	通常是跨平台框架（Node.js/Python），跑在服务端或开发者本地，不绑定特定用户桌面
核心能力	文件管理、系统配置、Android App 操作、Windows 窗口管理、搜索总结------一切围绕"这台电脑"	更偏向 Agent 编排、工具注册、多模型路由、协议适配等基础设施层能力
使用方式	自然语言直接对话，类 ChatGPT 的交互体验，开箱即用	需要开发者编写配置、注册工具、定义工作流，面向技术用户
Sub Agent 体系	内置 File / App / Computer / Browser / Search 等专用子 Agent，按专业领域自动路由	一般由开发者自行定义 Agent 角色和能力

简单说：Marvis 是一个面向终端用户、开箱即用的桌面 AI 助手 ，直接帮你操作这台电脑上的文件、软件和系统；而 OpenClaw 这类是面向开发者的 Agent 构建框架，需要你自己搭积木。一个是成品工具，一个是造工具的零件。说白了就是如果你要让Workbuddy之类整理某个文件夹中文件之类的任务，你得让它写skill和脚本，而Marvis是直接干。

自带云模型，零配置开箱即用

用过本地模型的开发者都懂那种痛苦------下载几个 G 的模型文件、折腾 CUDA 版本、调参、担心显存不够。Marvis 做了一个非常"腾讯"的决定：自带云模型，用户无需配置。

打开即用，不需要填 API Key，不需要选模型版本，不需要纠结 token 计费，目前是每天送1000万token，这很顶了。

我就感觉，"这直接就是下一个微信啊"------话虽有点夸张，但逻辑是通的：微信当年靠"零门槛"取代了需要复杂配置的即时通讯工具，Marvis 也在用同样的策略降低 AI 桌面工具的使用门槛。对技术用户来说你可以继续折腾本地模型，但对普通用户和强调效率的开发者，零配置就是最大优势。

关机也能工作？（待确认）

⚠️ 本文标注：此功能为待确认状态，具体实现方式以官方最终说明为准。

这一点是最让我好奇的。用户反馈中提到 Marvis "据说关机也能工作"，如果属实，意味着它可能具备某种常驻服务或云端协同机制------即使本地设备关机，后台任务仍可能通过云端的 Agent 实例继续执行。

从技术角度看，这可能会是一种"本地 Agent + 云端备份执行"的混合架构。如果真的落地，对于耗时较长的批量任务（比如大文件处理、定时任务、跨设备同步）会非常实用。但目前官方还未正式披露这一功能的细节，值得持续关注。

因为我是苹果手机，正好这个版本还在审核中，无法验证，我感觉是通过手机端控制云任务，然后开机同步的。

多 Agent + 协作机制，不是单打独斗

Marvis 不是"一个大模型干所有事"，而是内置了多 Agent 架构及协作机制。这不算亮点，现在市面上各类Agent都有，基本已经是标配了。

这个办公室挺有意思，我记得openclaw是一只龙虾，这个Marvis搞了一个团队放这里，给我一种监控员工的老板视角，感觉还不错，原来看员工在摸鱼真的想捏他呢。这意味着不同类型的工作可以由专门的 Agent 承接------读文件有 File Agent、搜图片有 Image Search、整理文件有 File Organizer------这些 Agent 之间可以互相传递任务上下文、分阶段协作。比如"找到所有发票 → 识别发票信息 → 输出到 Excel"这样的多步骤任务，背后可能是三个 Agent 在接力完成。

对开发者来说，这种架构思路并不陌生------它很像微服务的设计哲学：单一职责、组合协作、故障隔离。区别于很多 AI 工具"一个 Chatbot 打天下"的做法，Marvis 的多 Agent 设计给复杂任务提供了更稳定的执行保障。

技能广场，AI 版的"应用商店"

Marvis 也提供了一个技能广场，用户可以按需安装各类扩展技能------文档写作、Excel 分析、PPT 生成、发票识别、图片搜索等等。

这块跟其他虾马没什么区别，但也不可或缺，已经是基础设施标配了。

小结

Marvis 目前给我的感觉是：腾讯在认真做一款"让 AI 真正进入桌面工作流"的产品，而不是又做了一个 ChatGPT 的壳。这就好比自动架驶，电脑就是车，Marvis就是大脑。目前是L2级别，比较安全可控的级别，我觉得这确实就是未来的趋势，腾讯终于支棱起来了！

如果你也在关注 AI 工具从"对话式"向"代理式"的演进，Marvis 值得放进你的待观察清单。