Marvis 初步体验：它不像套壳聊天框，但还不能叫“贾维斯”

这两天 Marvis 的讨论不少。我先没有急着做很重的评测，而是从最基础的体验看了一圈：下载、安装、第一次打开、主界面，以及一个很简单的任务。

我比较关心的问题其实很具体：它到底只是把大模型聊天框套进桌面壳里，还是已经开始按桌面 Agent 的方式来做？

这次先不下大结论。复杂办公流、本地文档整理、跨网页研究、失败恢复和长时间任务稳定性，我准备后面再单独测。今天只聊第一次上手看到的几个点。

Marvis 初步体验封面

第一次打开，不是普通网页聊天框

我这次装的是 Windows 版。下载和启动都比较直接，打开后是独立客户端，而不是普通网页对话页。

这个细节看起来不大，但对桌面 Agent 很重要。

如果一个产品只是把聊天框放进桌面壳里，本质上还是问答工具。用户输入一句话，它回一段文字，最多再给几个链接。这样的工具当然有用，但离"替你操作桌面"还差很远。

桌面 Agent 要处理的事情更杂：本机应用、浏览器、文件、当前任务状态，以及执行动作前后要不要让用户确认。这些都不是一个网页聊天框能自然覆盖的。

Marvis 第一次启动时，没有直接把我丢进一个空白输入框，而是先让我选择使用场景。这个入口我觉得还可以。Agent 真要替人做事，至少得先知道用户大概想让它处理哪类任务，而不是默认所有人都只是来聊天。

当然，入口设计好不代表执行就一定稳。它只能说明 Marvis 没有把自己当成普通聊天工具来做。

Marvis 下载、安装和首次启动流程

主界面更像一个桌面控制台

进入主界面后，我第一眼看的是左侧导航。

这里不只是新建对话。左侧还有自动任务、技能广场、应用、文档、图库和此电脑。也就是说，Marvis 试图把聊天、任务、本地资源和应用入口放在同一个工作台里。

这一点比"只有一个聊天框"的产品更像桌面 Agent。

更有辨识度的是 Marvis 办公室。它把 Marvis、App Agent、Browser Agent 做成了看得见的角色，而不是把所有执行过程都藏在后台。

这点我挺喜欢。很多 Agent 产品最让人不放心的地方，不是它完全不能执行，而是过程太模糊。用户只看到一个进度条，不知道它在调用哪个能力，也不知道卡在哪里。

Marvis 把不同 Agent 的角色展示出来，至少让用户知道"谁在负责哪一段"。这会降低一点使用时的不确定感。

但这里也不能过度解读。界面把角色摆出来，不等于背后的多 Agent 协作就可靠。真正要看价值，还得看它在复杂任务里能不能正确分工、发现错误、从失败中恢复。

Marvis 主界面和多 Agent 控制台

我做了一个小任务测试

这次我只做了一个小任务：让它打开 Marvis 官网。

这个任务不难，但适合观察一个基本问题：自然语言指令能不能进入桌面执行，而不是只在聊天窗口里返回一句回答。

测试中，它理解指令后，把任务分发给 App Agent；当检测到多个浏览器时，还会让我选择使用哪个浏览器；最后网站正常打开。

这说明从指令到打开网页这一段流程跑通了：

用户输入自然语言指令
Marvis 判断任务类型
App Agent 接手执行
浏览器被调用
目标网页打开

这比"只回复一个链接"更进一步。

但这个测试也只能说明这一小段流程能跑通。真正难的不是打开网站，而是在复杂任务里持续规划、正确点击、识别异常、从失败中恢复，并且在高风险动作前让用户确认。

Marvis 打开网站的简单测试

这次试完，我的判断

Marvis 不像一个简单套壳聊天框。

它至少做了几件不像普通聊天框的事：独立客户端、首次场景选择、左侧资源入口、自动任务入口，以及能看到角色分工的多 Agent 工作区。

这些设计让它更像一个桌面 Agent 控制台，而不是普通聊天产品。

但我现在也不会把它当成成熟的智能管家。原因很简单：这次只测了下载、界面和一个小任务。真正能拉开差距的是更重的场景，比如整理本地文档、跨网页检索信息、自动生成表格、处理失败状态、连续执行多步任务。

所以我现在只敢下一个小判断：

它有点意思，从指令到打开网页这一段也跑通了，但真正麻烦的任务还没开始测。

为什么我暂时不下更重的结论

现在很多 AI 工具的演示视频都很漂亮，但真正长期使用时，问题往往出在细节里。

比如它能不能读懂一个本地文件夹里的资料，而不是只处理单个文件；能不能跨几个网页找信息，而不是打开一个页面就结束；能不能在网页弹窗、登录状态、浏览器选择这些小问题出现时继续往下走；如果中间执行错了，能不能停下来解释发生了什么，而不是继续硬点。

这些问题比"能不能打开一个网站"难很多，也更接近用户每天会遇到的真实场景。

所以我这次不想把话说满。Marvis 现在给我的第一印象是：设计上确实不是普通聊天框，执行入口也已经有了。但它能不能成为一个每天都愿意打开的桌面助手，还要看后面这些更细的任务。

我更希望下一轮测试能覆盖几个常见场景：

给它一个文件夹，看它能不能整理资料并说清楚依据
让它跨几个网页找信息，看它会不会只停留在第一个结果
给它一个需要多步操作的任务，看它遇到弹窗或页面变化时怎么处理
让它在可能影响本机文件或账号操作时，明确向用户确认

这些测试如果能跑顺，Marvis 的价值就会更明确。如果跑不顺，那它目前更像一个界面设计不错、方向也对，但还需要继续打磨的桌面 AI 工具。

还有一点也要单独看：它和用户之间的确认边界。

桌面 Agent 一旦能操作浏览器、文件和本地应用，就不能只追求"自动"。有些动作可以直接执行，比如打开网页、整理资料、生成草稿；有些动作必须先问清楚，比如修改文件、提交表单、发送内容、删除数据。一个好用的 Agent，不只是动作快，还要让用户知道它准备做什么、为什么要这么做，以及什么时候需要用户点头。

所以我后面不会只看它能不能完成任务，也会看它在任务过程中有没有解释和确认。这个细节很小，但决定了用户敢不敢长期把事情交给它。

下一期我会把任务难度拉高，重点看三件事：

本地文档整理：能不能读取和归纳文件
网页研究：能不能跨页面检索、筛选和总结
任务稳定性：遇到弹窗、浏览器选择、页面变化时能不能恢复

如果这些任务跑得稳，Marvis 才更接近大家想象里的桌面助手。如果跑不稳，它目前的价值就更像一个设计不错的桌面 AI 控制台。

这次先到这里。我的看法是：Marvis 值得继续观察，但别急着把它神化。

完整主站版本和后续深度测试会更新在这里：

https://kunpeng-ai.com/blog/marvis-basic-review-desktop-agent/