这两天 Marvis 的讨论不少。我先没有急着做很重的评测,而是从最基础的体验看了一圈:下载、安装、第一次打开、主界面,以及一个很简单的任务。
我比较关心的问题其实很具体:它到底只是把大模型聊天框套进桌面壳里,还是已经开始按桌面 Agent 的方式来做?
这次先不下大结论。复杂办公流、本地文档整理、跨网页研究、失败恢复和长时间任务稳定性,我准备后面再单独测。今天只聊第一次上手看到的几个点。

Marvis 初步体验封面
第一次打开,不是普通网页聊天框
我这次装的是 Windows 版。下载和启动都比较直接,打开后是独立客户端,而不是普通网页对话页。
这个细节看起来不大,但对桌面 Agent 很重要。
如果一个产品只是把聊天框放进桌面壳里,本质上还是问答工具。用户输入一句话,它回一段文字,最多再给几个链接。这样的工具当然有用,但离"替你操作桌面"还差很远。
桌面 Agent 要处理的事情更杂:本机应用、浏览器、文件、当前任务状态,以及执行动作前后要不要让用户确认。这些都不是一个网页聊天框能自然覆盖的。
Marvis 第一次启动时,没有直接把我丢进一个空白输入框,而是先让我选择使用场景。这个入口我觉得还可以。Agent 真要替人做事,至少得先知道用户大概想让它处理哪类任务,而不是默认所有人都只是来聊天。
当然,入口设计好不代表执行就一定稳。它只能说明 Marvis 没有把自己当成普通聊天工具来做。

Marvis 下载、安装和首次启动流程
主界面更像一个桌面控制台
进入主界面后,我第一眼看的是左侧导航。
这里不只是新建对话。左侧还有自动任务、技能广场、应用、文档、图库和此电脑。也就是说,Marvis 试图把聊天、任务、本地资源和应用入口放在同一个工作台里。
这一点比"只有一个聊天框"的产品更像桌面 Agent。
更有辨识度的是 Marvis 办公室。它把 Marvis、App Agent、Browser Agent 做成了看得见的角色,而不是把所有执行过程都藏在后台。
这点我挺喜欢。很多 Agent 产品最让人不放心的地方,不是它完全不能执行,而是过程太模糊。用户只看到一个进度条,不知道它在调用哪个能力,也不知道卡在哪里。
Marvis 把不同 Agent 的角色展示出来,至少让用户知道"谁在负责哪一段"。这会降低一点使用时的不确定感。
但这里也不能过度解读。界面把角色摆出来,不等于背后的多 Agent 协作就可靠。真正要看价值,还得看它在复杂任务里能不能正确分工、发现错误、从失败中恢复。

Marvis 主界面和多 Agent 控制台
我做了一个小任务测试
这次我只做了一个小任务:让它打开 Marvis 官网。
这个任务不难,但适合观察一个基本问题:自然语言指令能不能进入桌面执行,而不是只在聊天窗口里返回一句回答。
测试中,它理解指令后,把任务分发给 App Agent;当检测到多个浏览器时,还会让我选择使用哪个浏览器;最后网站正常打开。
这说明从指令到打开网页这一段流程跑通了:
- 用户输入自然语言指令
- Marvis 判断任务类型
- App Agent 接手执行
- 浏览器被调用
- 目标网页打开
这比"只回复一个链接"更进一步。
但这个测试也只能说明这一小段流程能跑通。真正难的不是打开网站,而是在复杂任务里持续规划、正确点击、识别异常、从失败中恢复,并且在高风险动作前让用户确认。

Marvis 打开网站的简单测试
这次试完,我的判断
Marvis 不像一个简单套壳聊天框。
它至少做了几件不像普通聊天框的事:独立客户端、首次场景选择、左侧资源入口、自动任务入口,以及能看到角色分工的多 Agent 工作区。
这些设计让它更像一个桌面 Agent 控制台,而不是普通聊天产品。
但我现在也不会把它当成成熟的智能管家。原因很简单:这次只测了下载、界面和一个小任务。真正能拉开差距的是更重的场景,比如整理本地文档、跨网页检索信息、自动生成表格、处理失败状态、连续执行多步任务。
所以我现在只敢下一个小判断:
它有点意思,从指令到打开网页这一段也跑通了,但真正麻烦的任务还没开始测。
为什么我暂时不下更重的结论
现在很多 AI 工具的演示视频都很漂亮,但真正长期使用时,问题往往出在细节里。
比如它能不能读懂一个本地文件夹里的资料,而不是只处理单个文件;能不能跨几个网页找信息,而不是打开一个页面就结束;能不能在网页弹窗、登录状态、浏览器选择这些小问题出现时继续往下走;如果中间执行错了,能不能停下来解释发生了什么,而不是继续硬点。
这些问题比"能不能打开一个网站"难很多,也更接近用户每天会遇到的真实场景。
所以我这次不想把话说满。Marvis 现在给我的第一印象是:设计上确实不是普通聊天框,执行入口也已经有了。但它能不能成为一个每天都愿意打开的桌面助手,还要看后面这些更细的任务。
我更希望下一轮测试能覆盖几个常见场景:
- 给它一个文件夹,看它能不能整理资料并说清楚依据
- 让它跨几个网页找信息,看它会不会只停留在第一个结果
- 给它一个需要多步操作的任务,看它遇到弹窗或页面变化时怎么处理
- 让它在可能影响本机文件或账号操作时,明确向用户确认
这些测试如果能跑顺,Marvis 的价值就会更明确。如果跑不顺,那它目前更像一个界面设计不错、方向也对,但还需要继续打磨的桌面 AI 工具。
还有一点也要单独看:它和用户之间的确认边界。
桌面 Agent 一旦能操作浏览器、文件和本地应用,就不能只追求"自动"。有些动作可以直接执行,比如打开网页、整理资料、生成草稿;有些动作必须先问清楚,比如修改文件、提交表单、发送内容、删除数据。一个好用的 Agent,不只是动作快,还要让用户知道它准备做什么、为什么要这么做,以及什么时候需要用户点头。
所以我后面不会只看它能不能完成任务,也会看它在任务过程中有没有解释和确认。这个细节很小,但决定了用户敢不敢长期把事情交给它。
下一期我会把任务难度拉高,重点看三件事:
- 本地文档整理:能不能读取和归纳文件
- 网页研究:能不能跨页面检索、筛选和总结
- 任务稳定性:遇到弹窗、浏览器选择、页面变化时能不能恢复
如果这些任务跑得稳,Marvis 才更接近大家想象里的桌面助手。如果跑不稳,它目前的价值就更像一个设计不错的桌面 AI 控制台。
这次先到这里。我的看法是:Marvis 值得继续观察,但别急着把它神化。
完整主站版本和后续深度测试会更新在这里:
https://kunpeng-ai.com/blog/marvis-basic-review-desktop-agent/