前言
9 月 9 日,在 Wavesummit 开发者大会上,文心快码全新升级为 3.5S(Super Synergistic AgentS) 版本,带来了一个叫"多智能体自协同引擎"的新机制。也就是说,智能体之间不再是你发一个任务就它硬干,而是能自主协作、分工合作,共同完成复杂任务。官方说这是为了满足开发者的三大核心需求:
- 通晓项目环境
- 驾驭复杂任务
- 实现高效体验
我比较关注是下面这几个重点:
- Surper-智能体能力更强 可以自定义 Agent,打造专属懂你业务的"小伙伴"。 新增 To-Do 模式:自动拆解你的任务,生成代办事项,实时跟踪与确认。
- Synergistic-从单智能体到多智能体协同 新增 Subagents:动态生成多个智能体,彼此协作一起解决复杂任务。 突破上下文窗口限制,可以应付更长、更复杂的输入。
- Architect 模型: 基于 SubAgent 架构,上下文几乎无限扩展;能拆解复杂问题并分工、编排,自动调用其他智能体,完成复杂需求交付。
刚好我有个 idea 想试试,想做一个 统计网页浏览时间的插件 ,同时还要能 统计摸鱼时间 ,看这个升级到底能不能真落地。
需求讲解
基本需求
插件要能做到以下这些:
- 统计用户在不同网站(域名)上的停留时间;
- 数据能持久保存,浏览器关闭重开后数据不丢失;
- 弹出插件界面(popup)默认显示当天的统计,以饼图可视化的形式;
- 支持查看历史数据,可以选择某个日期查看那天的统计;
- 代码要清晰,关键流程要有注释;插件可以在开发者模式下直接加载运行。
进阶 / 二期(摸鱼模式)
实现基础版可以体现出从 0 到 1 的开发效果,但大多数情况下,我们都是从 1 到 N 进行开发。所以我也会让它进行一个二次开发,基于基础版本,加一个"摸鱼模式"作为后续功能:
- 用户可以切换模式 "正常模式"------"摸鱼模式";
- 在摸鱼模式下,仅展示某些"非生产类网站"(比如视频网站、社交媒体等);
- 用户可以手动将当前网站作为摸鱼网站;
- 其他功能要和基础版一致。
我的计划是,先做基础版,确认没问题以后再让文心快码做进阶摸鱼模式。
实现过程
文心快码支持各大主流 IDE 的插件版,也有自己的 AI IDE,我用的是它的 AI IDE,名字叫 Comate AI IDE。

目前版本有7个自带的Agent,分别适合不同的工作,挑三个重点的Agent给大家介绍下:
- Zulu:灵活、通用的开发Agent
- Plan:专注于理解项目,并根据用户需求来做规划
- Architect:基于SubAgent架构,自动分析需求,并且灵活调用其他Agent来完成任务,上面给大家讲过这个。

模型支持国内主流的几个大模型,同时也支持 Auto 模式,我后续开发都是用的 Auto。

还可以配置SubAgent,这个功能是本次更新的一个重点升级。

文心快码分析 & 初版效果
OK,我们先把基础版的需求发给文心快码,让它进行实现。
这次我用的是通用的 Zulu 模式。

文心快码接受提示词后,自动拆分了任务,并且做了一个 ToDo 列表,一步一步完成。不一会就做完了第一版,我没有进行任何调整,直接尝试在浏览器打开,得到了下面这个东西:
嘿嘿,这个样式还是比较符合预期的,但是没有数据,也没有图表,关键是居然生成了个英文版的。
马上跟文心快码进行了反馈,得到了第二版。
这个看着就亲切多了,然后我也找了几个网站测试了下,统计时间啥的也没什么问题。还支持表更图表,可以划掉一些网站,让饼图只显示剩下的网站。
我又多测试了几轮,持久化、日期切换、清空数据、导出数据这些功能都实现了,符合了我第一版的需求。
但我发现在使用体验上还是有一个小问题,就是这个饼图无法实时更新,如果我连续去点击这个插件,它每次展示的都是一样的数据,除非刚好到它刷新的时间点了,才会更新数据。
而我希望每次我点击这个插件进场查看的时候,它都能马上刷新一次,让我看到最新的数据。沟通了几轮之后,这个调优的问题也算是搞定了,这比起国外那几个顶尖模型确实有点差距。
这中间有一个小插曲,挺有意思的,由于我是个后端仔,浏览器插件我还是第一次开发,我以为直接F12就可以在控制台看到插件日志了,但是不知道为什么就是没有。然后我就问文心,结果它给我生成了一份教程文档,给了我三种方法。

我按照方法进行尝试,果然是找到了看日志的地方,原来是专门有个开发者工具的,学习了~

二期:摸鱼模式 + Architect 模式
要做 "摸鱼模式" 的时候,我决定试试 Architect 模式。
我把二期的需求发给了文心快码,然后看到在 Architect 模式下,文心快码会把整体需求拆得更细、更模块化,并调用了多个 Subagents 分工来做"摸鱼模式"的逻辑:
- 首先让Deep Read对项目结构和功能进行分析
- 然后让Actor来实现了具体的代码逻辑

实际上,我们还可以展开SubAgent的任务细节来,可以看到它内部也有很多的步骤,SubAgent做完之后又把它分析得到的信息传给了上级Agent,这个确实挺有意思的。

这次的任务结果让我挺惊讶的,一次就把摸鱼功能搞定了,完全没有二次沟通。我在浏览器测试了半天,确认它确实完成了功能,并且没有发现额外的bug。
当我点击上面的大标题之后,就会切换到摸鱼模式(切换的时候会有个toast),只会统计我摸鱼的时间,并且也具有排除当前页面的功能,我已经通过这个功能,把其他那些干活的页面都给排除掉了。
再切换回正常模式,数据也能够正确的展示,非常nice!
尾声
整体体验下来,文心快码 3.5S 这次的升级确实很有看点:多智能体协同 + Architect 架构 + 更强的上下文能力。
尤其是我后面使用的 Architect 模式,解决需求的能力明显高了很多,第一期功能实现还进行了多轮对话才完成,而第二期需求仅一次对话就搞定了。
上下文能力确实也调校的很好,在整个过程里,文心快码没有出现上下文丢失或者关键代码拼接错乱的问题。即使经过好几轮让它优化,它都记得之前的需求,没有碰到"遗忘上文"的情况。
当然,对比起国外顶尖的大模型和AI IDE,仍然有一定的提升空间,对付一些大项目的时候,也还会稍显乏力。但在处理中小型需求时,它已经完全能够胜任。就目前的发展速度来看,未来是很值得期待的。
