Marvis:腾讯悄悄搞了个 AI 桌面助手,有点意思

Marvis:腾讯悄悄搞了个 AI 桌面助手,有点意思

一个能直接操控你电脑文件、据说关机还能跑、自带云模型和多 Agent 协作的桌面 AI 工具,到底能做什么?


最近体验了一款叫 Marvis 的 AI 桌面助手,来自腾讯。在我看来,腾讯都是喜欢后发制人,然后占领高点。这一次推出的Marvis让我感觉不一样,就像他们认定了这个东西一定是个正确的方向,已经不再像以往那样左右观望了--在国内外还几乎没有类似的产品出来的情况下,直接就推出了Marvis。你还别说,上手之后有几个点确实让人眼前一亮,分享给关注 AI 工具链的同学。


直接访问本机文件和应用,真正的"桌面级"AI

很多 AI 工具都困在浏览器里------它们能聊、能搜、能生成代码,但碰不到你电脑上的真实文件。Marvis 不一样:它能直接访问本机文件系统和已安装的应用

这意味着你可以对它说"帮我整理桌面上的发票,按月份分到对应文件夹",或者"把上周下载的那份合同转成 PDF 发给我"------它真的能动手去做,而不是告诉你"请手动操作以下步骤"。

对开发者来说,想象一下让它帮你批量处理项目中的配置文件、扫描代码仓库中的敏感信息,或者自动整理散落在各处的技术文档------这些都是本地文件操作的真实场景。

虽说这界面跟别的Agent不同了,但我还是不太明白区别,我直接问Marvis:你跟openclaw workbuddy 悟空 之类有什么区别呢?它这样回复:

Marvis 与这几个产品/框架的区别主要体现在定位和运行环境上:

维度 Marvis OpenClaw / WorkBuddy / 悟空
定位 桌面智能助手,深度绑定当前 Windows 环境,以本地文件、应用、系统操作为核心 多为通用 AI Agent 框架或 SDK,面向开发者构建自定义 Agent 应用
运行环境 运行在用户本地 Windows 电脑上,直接操作本地文件系统、桌面应用、Android 模拟器 通常是跨平台框架(Node.js/Python),跑在服务端或开发者本地,不绑定特定用户桌面
核心能力 文件管理、系统配置、Android App 操作、Windows 窗口管理、搜索总结------一切围绕"这台电脑" 更偏向 Agent 编排、工具注册、多模型路由、协议适配等基础设施层能力
使用方式 自然语言直接对话,类 ChatGPT 的交互体验,开箱即用 需要开发者编写配置、注册工具、定义工作流,面向技术用户
Sub Agent 体系 内置 File / App / Computer / Browser / Search 等专用子 Agent,按专业领域自动路由 一般由开发者自行定义 Agent 角色和能力

简单说:Marvis 是一个面向终端用户、开箱即用的桌面 AI 助手 ,直接帮你操作这台电脑上的文件、软件和系统;而 OpenClaw 这类是面向开发者的 Agent 构建框架,需要你自己搭积木。一个是成品工具,一个是造工具的零件。说白了就是如果你要让Workbuddy之类整理某个文件夹中文件之类的任务,你得让它写skill和脚本,而Marvis是直接干。


自带云模型,零配置开箱即用

用过本地模型的开发者都懂那种痛苦------下载几个 G 的模型文件、折腾 CUDA 版本、调参、担心显存不够。Marvis 做了一个非常"腾讯"的决定:自带云模型,用户无需配置

打开即用,不需要填 API Key,不需要选模型版本,不需要纠结 token 计费,目前是每天送1000万token,这很顶了。

我就感觉,"这直接就是下一个微信啊"------话虽有点夸张,但逻辑是通的:微信当年靠"零门槛"取代了需要复杂配置的即时通讯工具,Marvis 也在用同样的策略降低 AI 桌面工具的使用门槛。对技术用户来说你可以继续折腾本地模型,但对普通用户和强调效率的开发者,零配置就是最大优势。


关机也能工作?(待确认)

⚠️ 本文标注:此功能为待确认状态,具体实现方式以官方最终说明为准。

这一点是最让我好奇的。用户反馈中提到 Marvis "据说关机也能工作",如果属实,意味着它可能具备某种常驻服务或云端协同机制------即使本地设备关机,后台任务仍可能通过云端的 Agent 实例继续执行。

从技术角度看,这可能会是一种"本地 Agent + 云端备份执行"的混合架构。如果真的落地,对于耗时较长的批量任务(比如大文件处理、定时任务、跨设备同步)会非常实用。但目前官方还未正式披露这一功能的细节,值得持续关注。

因为我是苹果手机,正好这个版本还在审核中,无法验证,我感觉是通过手机端控制云任务,然后开机同步的。


多 Agent + 协作机制,不是单打独斗

Marvis 不是"一个大模型干所有事",而是内置了多 Agent 架构及协作机制。这不算亮点,现在市面上各类Agent都有,基本已经是标配了。

这个办公室挺有意思,我记得openclaw是一只龙虾,这个Marvis搞了一个团队放这里,给我一种监控员工的老板视角,感觉还不错,原来看员工在摸鱼真的想捏他呢。这意味着不同类型的工作可以由专门的 Agent 承接------读文件有 File Agent、搜图片有 Image Search、整理文件有 File Organizer------这些 Agent 之间可以互相传递任务上下文、分阶段协作。比如"找到所有发票 → 识别发票信息 → 输出到 Excel"这样的多步骤任务,背后可能是三个 Agent 在接力完成。

对开发者来说,这种架构思路并不陌生------它很像微服务的设计哲学:单一职责、组合协作、故障隔离。区别于很多 AI 工具"一个 Chatbot 打天下"的做法,Marvis 的多 Agent 设计给复杂任务提供了更稳定的执行保障。


技能广场,AI 版的"应用商店"

Marvis 也提供了一个技能广场,用户可以按需安装各类扩展技能------文档写作、Excel 分析、PPT 生成、发票识别、图片搜索等等。

这块跟其他虾马没什么区别,但也不可或缺,已经是基础设施标配了。


小结

Marvis 目前给我的感觉是:腾讯在认真做一款"让 AI 真正进入桌面工作流"的产品,而不是又做了一个 ChatGPT 的壳。这就好比自动架驶,电脑就是车,Marvis就是大脑。目前是L2级别,比较安全可控的级别,我觉得这确实就是未来的趋势,腾讯终于支棱起来了!

如果你也在关注 AI 工具从"对话式"向"代理式"的演进,Marvis 值得放进你的待观察清单。


相关推荐
大模型真好玩7 小时前
大模型训练全流程实战指南工具篇(十二)—— 大模型评测方法及典型评测集介绍
人工智能·agent·deepseek
prog_61037 小时前
【笔记】用cursor手搓cursor(六)deepseek v4
人工智能·笔记·agent·deepseek·claude code
倾颜8 小时前
做 AI 应用时,Agent、RAG、Tool、Skill、MCP 这些概念怎么分工?
agent·ai编程·mcp
uccs8 小时前
写一个轻量级本地 Mock Model
agent·ai编程·claude
码哥字节8 小时前
Anthropic 把 SOC 误报率从 33% 砍到 7%,真正在干活的不是 Claude
agent
阿里云云原生8 小时前
阿里云的 Agent Infra 长什么样
阿里云·云计算·agent
caicongyang8 小时前
开源项目OpenCLI 扫盲
agent·cdp·opencli
小歪不歪我是AI8 小时前
Pi 源码拆解:当一个极简主义的 agent harness 只有 4 个 tool
开源·agent
元思未来9 小时前
Hermes Agent 源码探秘 (4):工具系统 — Agent 的"双手"
agent