Peri Code: Agent 能力和用户判断力的不对称

Peri Code: Agent 能力和用户判断力的不对称

Peri Code --- 用 Rust 写的开源 Coding Agent,兼容 Claude Code 生态。github.com/KonghaYao/p...

打开 Claude Code 或 Peri,给 agent 一个 goal(用户设定目标、agent 自动续跑到完成的执行模式)「重构消息管线」,按 enter,离开去做别的事。三个小时后回来,agent 已经跑完了。800 行代码、跨 12 个文件、改了 5 个 trait,测试通过。你坐下来读代码,读到一半发现,agent 抽象的那个 trait 形状,破坏了你原本打算保留的流式语义边界,整套抽象要推倒重来。

这一回合里 Agent 表现出 4 个维度的能力。它自主分解了消息管线重构的子任务(高自主),三小时持续执行不需要你介入(高自动),跨 12 个文件写了 800 行代码(强执行),从 trait 抽象到适配器实现再到测试的多个层面都被改动(广覆盖)。你那一端只有一句模糊的 goal。Agent 太强了,把这句模糊 goal 里所有缺位的判断放大成了 800 行偏离的代码。

Agent 能力进化与用户判断力滞后的对照

当前 AI Agent 的能力在四个维度上同时快速进化。决策权从用户转移到 agent,agent 自己分解任务、选实现路径、决定下一步。介入频率被压到最低,agent 在用户离开的情况下持续执行几小时。单次任务的执行规模显著放大,能跑完几百到几千行代码改动、跨多个文件。覆盖范围从架构延伸到实现、测试、文档多个层面。

用户端需要跟上的是判断力------什么方向是对的、什么实现是稳健的、什么改动会破坏现有架构、什么取舍是可以接受的。这种判断力需要用户对自己的项目有深度把控,对架构规则有清晰认知,并明确取舍边界。大部分用户没在这个层面做训练。

不对称的后果是 Agent 每变强一档,用户的判断弱势被放得越大一档。Agent 弱的时候,用户每个 commit 都在自然做微调,错误方向被持续纠正;Agent 强的时候,用户介入频率压到最低,单次介入的判断密度被推到最高,缺位的代价被工具的力量放大成不可逆的代码改动。

goal 和 dynamic workflow 是高自主 Agent 的极端形态

goal 和 dynamic workflow(agent 自行分解任务步骤的执行模式)是当前高自主 Agent 最极端的两种形态,把能力不对称暴露得最显眼。

goal 模式把用户介入频率压到两次,设定目标和接收结果。中间所有价值判断,做不做某个子任务、用哪种实现策略、是否打破现有架构、做到什么程度算完成,全部由 agent 完成。dynamic workflow 走得更远,用户连路径都不提供,只提供「我要做 X」这一句话,agent 自己决定怎么拆、怎么做。

这两种工具的设计假设是「用户已经想清楚自己要什么、agent 替用户执行」。在用户确实想清楚的情况下,这套机制是高效的杠杆。工具不能验证用户是否真的想清楚了------它接到任何目标都照常工作。用户给一个模糊的目标,agent 沿着模糊方向生成路径;用户给一个错误方向的目标,agent 沿着错误方向跑。

工具厂商不能解决这个问题。Peri 自己也复刻了 codex 的 /goal 系统,越实现越确认这个设计在它的工作范围内是对的------它确实能替用户高效执行。但工具的工作范围默认了用户侧的判断力到位。这个默认在高自主 Agent 时代是危险的,大部分用户没意识到自己被默认成了「判断力到位的人」。

用户判断力缺位的三种形态

认知缺位------用户被「自动化」话语诱导,根本不知道自己在关键节点需要做价值判断。「设定目标、自动续跑」这种营销话语暗示「人可以退出」,用户真的以为自己可以退出。用户只是从执行链路里退出,价值判断的责任一点没少,只是被默认成了「LLM 觉得合理」。

能力缺位------用户知道要做判断,但不知道怎么做。大部分用户没培养 plan(在脑子里跑一遍路径、阶段里程碑、每步取舍规则)的习惯,开口前不会先把目标拆解、把架构约束想清楚、把取舍边界定下来。这种能力需要训练,大部分人没训练过。

姿势错位------用户把 goal 当 plan 用。goal 是「我要去哪」,plan 是「分几步走、每步的取舍规则、不做什么」。用户跳过 plan 阶段,把一个 goal 直接喂给 agent,期望 agent 自己生成路径。路径里的每一个分叉点都是价值判断,agent 没有这个判断所需要的信息,比如产品方向、架构规则、稳健性标准。它只能用 LLM 训练数据里的「统计合理」替代用户的「具体判断」。统计合理在通用场景下成立,在你的项目里未必成立。

不对称累积的三层代价

能力不对称的代价分三层渐进累积。第一层是返工。Agent 沿着模糊或错误的初始目标跑偏方向,用户回来 review 发现路径不对,推倒部分代码重写。返工的成本是执行时间的几倍,你不仅要重写,还要先理解 agent 写的代码、定位跑偏点、判断哪些能保留。

第二层是架构失守。Agent 在某个关键节点做了破坏架构的决策,比如抽象错的 trait 形状、引入不对的依赖、选了不对的状态机划分,后续所有代码都建立在这个错误决策上。代码能编译、测试能通过,但项目的架构骨架已经偏了。等你发现的时候,往往整套建立在错误地基上的代码都要重新设计。

第三层是项目失控感。多次返工和架构失守累积后,用户不再信任自己对项目的把控力。用户面临两种走向,彻底放弃自动化回到手动,效率跟不上项目节奏;或者彻底放弃判断完全依赖 agent,项目方向脱离用户的实际意图。

plan 作为开口前的判断闸门

Agent 能力的进化不会停,用户判断力的训练只能靠用户自己。这个不对称会持续存在,会随着 Agent 变强继续扩大。

在开口前把 plan 在脑子里跑一遍------你要去哪、怎么走、哪些实现不能碰。这些判断只能由用户做。Agent 越强大,越要在开口前完成这个动作,否则工具的力量会替你把缺位的判断放大成不可逆的代价。

开头那个 800 行返工,问题在你那句模糊的 goal。下次开口前,先把 plan 想清楚------这是 Agent 越强大越不能省的动作。

项目地址:github.com/konghayao/p...

相关推荐
Avan_菜菜4 分钟前
使用 Docker + rclone 自建 WebDAV
后端·agent·claude
lxmjlove7 小时前
读懂 AgentFlow:让 Agent 在「执行过程中」学会规划和用工具
agent
DigitalOcean8 小时前
DigitalOcean 推出大模型自动化评估功能,上线前精准避坑
llm·agent
Databend9 小时前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent
柒和远方9 小时前
Phase 7.2 RAG SafetyGuard:把用户上传资料当成低信任证据
aigc·agent
colir09 小时前
被粉丝夸爆的超级 ai 个人工作站,原来这么多福利
开源·agent·claude
程序员小假9 小时前
从问题到答案:RAG系统完整处理流程与核心机制深度拆解
后端·面试·agent
柒和远方9 小时前
Phase 6.8:把 KnowledgeDedupAgent / KnowledgeOrganizerAgent 补成可用闭环
agent
阿里云大数据AI技术10 小时前
MaxCompute Agentic 工具套件首发:面向所有 Agent 提供标准化数据服务
人工智能·agent
百度Geek说10 小时前
协作的逆向演进:从 Agent 逻辑重构团队管理
agent·团队管理