上周 Cursor 发了 3.1,加了分屏多 Agent。我从 3.0 就开始用了,到现在差不多两周,说说这东西到底值不值得升级。
先说结论
Cursor 3 把整个 IDE 的交互逻辑改了。以前打开 Cursor,看到的是文件树、编辑器、终端,跟 VS Code 没什么区别。现在打开 Agents Window(Cmd+Shift+P 搜 Agents Window),你看到的是一排 Agent 卡片,每个 Agent 在独立干活。
说白了,Cursor 从"你写代码,AI 帮你补"变成了"你派活,Agent 替你写"。
Agents Window 长什么样
左边是 Agent 列表,右边是当前 Agent 的工作区。3.1 更新之后支持分屏,可以同时盯两三个 Agent 的输出。
每个 Agent 有自己的状态:思考中、写代码中、等确认、已完成。你可以同时开好几个,一个改前端组件一个写后端接口,各自在独立的 worktree 里工作,互不干扰。
以前用 Cursor 的 Agent 模式,本质上还是单线程,你给一个任务,等它做完,再给下一个。现在是真的并行了。
实际用下来怎么样
前后端同时开工
我有个项目要加用户反馈功能。以前的做法是先写后端接口,等接口好了再写前端页面。现在我开两个 Agent:
- Agent A:写一个 POST /api/feedback 接口,接收 content 和 rating 字段,存到数据库
- Agent B:写一个反馈表单组件,包含文本框和评分选择
两个 Agent 同时干活,各自在自己的 worktree 里改代码。三四分钟两边都写完了,review 一下合并就行。以前串行做至少十分钟,现在五分钟搞定。
Design Mode 标注 UI
这个功能我觉得挺有意思。在浏览器里打开你的页面,开启 Design Mode,直接在页面上点某个元素,标注"这个按钮颜色改成蓝色"或者"这个间距太大了"。
Agent 能直接看到你标注的是哪个元素,不用费劲描述"就是那个第三行第二列的按钮"。写前端的应该懂这种痛苦,跟 AI 描述 UI 位置比跟产品经理对需求还累。
从手机上派活
Cursor 3 支持从手机、Web、Slack、GitHub 启动 Agent。我试过在地铁上给 Agent 派了个任务:"把 README 里的安装步骤更新一下,加上 Docker 部署的说明。"
到公司打开电脑,Agent 已经改好了等我确认。通勤路上想到什么改动,手机上发一条,到工位直接 review,这个体验确实不错。
跟 Claude Code 比呢?
这个问题被问了好多次。
Cursor 3 更适合喜欢在 IDE 里干活的人,可视化反馈快,前端开发和团队协作场景用着顺手。Claude Code 更适合终端党,项目复杂度高的时候它对代码库的理解更深,自主性也更强。
我现在两个都用。日常改 bug、写小功能用 Cursor 3,大的重构、跨多个文件的改动用 Claude Code。两个加起来 $40/月,不便宜,但每天写代码超过 4 小时的话,省下来的时间远超这个成本。
几个坑
用了两周踩了一些坑,提前说一下。
多 Agent 冲突。 虽然每个 Agent 在独立 worktree 里工作,但两个 Agent 改了同一个文件的同一个区域,合并的时候还是会冲突。派活的时候注意任务边界,别让两个 Agent 改同一个组件。
额度消耗快。 Pro 计划 <math xmlns="http://www.w3.org/1998/Math/MathML"> 20 / 月给 20/月给 </math>20/月给20 的模型额度。多 Agent 并行的时候,额度消耗是成倍的。我第一周就把额度用完了,后面几天只能用免费模型,体验差了不少。
如果你用的模型比较贵(比如 Claude Opus 4.6 或 GPT-5.4),可以接一个第三方 API 平台控制成本。我自己用的是 ofox.ai,一个 API 能调 50 多个模型,按量付费不用担心月度额度的问题。Cursor 里改一下 API 地址就行:
arduino
Settings → Models → OpenAI API Base URL → https://api.ofox.ai/v1
Design Mode 偶尔抽风。 它依赖浏览器扩展,有时候标注的元素和实际 DOM 对不上,Agent 改错地方。刷新页面重新标注就好,不是什么大问题。
值不值得升级?
在用 Cursor 2.x 的话,升级免费,没理由不试。Agents Window 可以随时切回传统 IDE 视图,不影响原来的工作流。
还没用过 Cursor 的话,现在是个不错的入坑时机。3.0 的 Agents Window 加上 3.1 的分屏,多 Agent 并行开发的体验已经比较成熟了。
当然 AI Agent 不是万能的,复杂的业务逻辑它还是会犯错。我的定位是把它当成一个能同时干好几件事的初级开发者,我负责 review 和把关。心态放对了,用起来就舒服多了。
后面会继续写 Claude Code、Cline、Windsurf 这些工具的使用体验,评论区聊聊你们在用什么。