MateClaw v1.4.0 发布:从“会用工具的 Agent”到“能持续交付的数字员工”

版本:v1.4.0

发布日期:2026-05-25

项目地址:https://github.com/matevip/mateclaw

文档:https://claw.mate.vip/docs

在线演示:https://claw-demo.mate.vip

MateClaw v1.4.0 已经发布。

这版最值得说的,不是"功能又多了几个",而是 MateClaw 的产品形态变了:它开始从一个会调用工具的 AI 助手,往一个能跑长任务、能带子员工、能受权限约束、能进企业 IM 的 Agent Runtime 演进。

白话讲:以前你问它一句,它答一句;现在你可以交给它一件事,让它盯目标、拆步骤、找别的员工协作、在飞书里要审批、在后台保留进度。

先看这版做了什么

v1.4.0 的主线可以概括为五件事:

  1. 持久化目标 Goal:让员工记住"我现在到底要完成什么",并按完成条件持续评估。
  2. 子员工委派树:员工可以同步、并行、异步委派其他员工,形成多层协作树。
  3. 渐进式工具/技能披露:工具和技能不再全量塞进提示词,需要时再打开。
  4. 工作空间 RBAC:Owner / Admin / Member / Viewer 四级角色,让团队能分权限使用。
  5. 飞书一等公民:互动卡片、审批卡片、流式卡片、语音、文件、音视频和渠道原生工具。

本地 v1.4.0 Dashboard 如下:

1. Goal:员工开始自己盯目标

很多 Agent 产品最大的问题是:看上去很聪明,但每一轮都像重新开始。

你说"帮我完成这篇文章的英文版发布",它可能先改一段,下一轮又要你提醒"还有摘要、配图、发布渠道"。真正的员工不应该这样。员工应该知道:

  • 目标是什么;
  • 完成条件是什么;
  • 还差哪些步骤;
  • 是否应该继续;
  • 什么时候该停。

v1.4.0 的 Goal 就是为这个问题做的。

在 UI 上,Goal 不做成一个很重的弹窗,而是进入聊天状态:头像旁边有光环,消息流里能看到 setGoaladdGoalCriterioncompleteGoal 等工具结果。

源码里,Goal 不是一句 prompt。它是数据库状态机。

GoalServiceImpl 明确做了三层保护:

  • 一个 conversation 同一时间最多一个 active goal;
  • 状态更新使用乐观锁;
  • goal 更新和事件日志写入放在事务里。

对应源码:mateclaw-server/src/main/java/vip/mate/goal/service/GoalServiceImpl.java

关键点在 create 里:创建时写入 conversationIdagentIdworkspaceIdcreatedByturnBudgetllmCallBudgetautoFollowupEnabled,并写事件和审计。完成时还会把结果同步进长期记忆。

这说明 v1.4.0 的 Goal 不是"让模型记住一句话",而是把目标变成运行时状态。

2. Progress Ledger:长任务不怕上下文裁剪

v1.4.0 近期提交里有一组很关键:

text 复制代码
29d109fa feat(agent): per-conversation progress ledger to survive context trims
79f4f580 feat(agent): require ledger discipline in system prompt for multi-step tasks
abc0896b feat(agent): inject stale-ledger reminder when the model stops updating
dd848fae feat(agent): include progress-ledger snapshot in limit-exceeded wrap-up

这组改动说明 MateClaw 在解决一个真实问题:长任务跑久了,上下文会被裁剪,模型很容易忘记"哪些步骤做完了"。

ProgressLedgerService 把进度账本持久化在 mate_conversation.progress_ledger 字段里,并用 conversation 级锁保护并发写入。ProgressLedgerTool 暴露 progress_update,让员工在每个步骤变更时更新账本。

对应源码:

  • mateclaw-server/src/main/java/vip/mate/agent/progress/ProgressLedgerService.java
  • mateclaw-server/src/main/java/vip/mate/tool/builtin/ProgressLedgerTool.java

这比"让模型自己记着"靠谱得多。模型可以忘,数据库不能忘。

3. 子员工委派树:一个员工可以带一支小队

v1.4.0 把多 Agent 协作往前推了一步。

员工现在不只是自己干活,还能把任务分出去:

  • delegateToAgent:同步委派一个员工;
  • delegateParallel:并行委派多个员工;
  • delegateAsync:异步委派,先拿 task_id,后续再取结果;
  • 最多递归 3 层;
  • 每个子员工有 subagentIdparentSubagentIddepth

实时视图也被合并进员工页:

源码里,DelegateAgentTool 负责这套委派能力。文件开头就说明:委派员工在独立 child conversation 里运行,进度通过 SSE 事件回流到 parent session。它还设置了 MAX_DELEGATION_DEPTH = 3,并给并行委派设了数量和超时限制。

对应源码:mateclaw-server/src/main/java/vip/mate/tool/builtin/DelegateAgentTool.java

这就是 v1.4.0 的一个核心变化:Agent 不只是"自己调用工具",而是开始能组织其他 Agent。

4. 渐进式工具/技能披露:工具很多,也不撑爆上下文

Agent 接入越多工具,系统提示越容易膨胀。以前很多系统会把全部工具 schema 都塞给模型,结果模型还没开始做任务,工具说明就吃掉大量上下文。

v1.4.0 改成两层:

  • Core 工具:默认可见;
  • Extension 工具:只展示目录,需要时用 enable_tool 打开;
  • Skill:需要时用 load_skill 读取 SKILL.md

源码里,AgentGraphBuilder 同时注入了 SkillRuntimeServiceToolDisclosureService,并在图状态里注册 LOADED_SKILLSENABLED_EXTENSION_TOOLS。这意味着"加载了哪些技能、打开了哪些扩展工具"是当前运行图的一部分,而不是前端临时状态。

对应源码:mateclaw-server/src/main/java/vip/mate/agent/AgentGraphBuilder.java

MCP 也支持分层。McpServerService#setDisclosureTier 可以把整个 MCP server 的工具组设置成 coreextension,不需要重连,因为分层只影响工具如何暴露给 LLM。

这对企业部署很重要。企业工具会越来越多,但员工每一轮真正需要看的工具应该很少。

5. RBAC:从个人工具到团队系统

v1.4.0 加了工作空间 RBAC。

角色分四级:

角色 典型使用者 能力
Viewer 旁观者、实习生 聊天、看 Wiki
Member 业务同事、运营 管 Agent、Wiki、记忆、Dashboard
Admin 空间管理员 管技能、渠道、模型、安全、设置
Owner 空间所有者 Admin 能力 + owner 专属动作

源码里,RoleCapabilities 是角色到 capability 的单一事实源。前端不自己推导权限,而是通过 /api/v1/workspaces/{id}/access 获取 effectiveRolecapabilities

对应源码:

  • mateclaw-server/src/main/java/vip/mate/workspace/core/security/RoleCapabilities.java
  • mateclaw-server/src/main/java/vip/mate/workspace/core/service/WorkspaceService.java

这也是 MateClaw 走向企业化的关键一步。单人产品可以只有 admin,团队产品必须有权限边界。

6. Tool Guard 与审批:Agent 能做事,也要能被管住

Agent 一旦能调工具、发文件、跑任务,就不能只靠"相信模型"。

v1.4.0 继续强化了工具治理。Tool Guard 页面可以配置安全规则、阻断规则和审批策略:

从源码看,工具执行进入 ToolExecutionExecutor 后,会先做 JSON 参数校验,再经过 ToolGuard。如果命中需要审批的规则,就进入 approval barrier,当前工具后面的兄弟工具不会继续执行,等审批通过后再 replay。

对应源码:mateclaw-server/src/main/java/vip/mate/agent/graph/executor/ToolExecutionExecutor.java

这就是企业 Agent Runtime 必须补上的一层:不是让 Agent 少做事,而是让它做事时可控、可恢复、可审计。

7. 飞书一等公民:员工进入真实协作场景

v1.4.0 里飞书不再只是"能收发文本"。

它支持:

  • 互动卡片;
  • 审批卡片;
  • CardKit 流式卡片;
  • 语音转写;
  • 文件、音频、视频收发;
  • 生成文件转飞书原生附件;
  • 飞书日历、文档等渠道原生工具。

源码里,FeishuChannelAdapter 的配置项已经覆盖 card_formatrequire_mentionmedia_download_enabledenable_quoted_context 等;类成员里也能看到 FeishuStreamingCardManagerFeishuCardDispatcherGeneratedFileScrubberGeneratedFileCacheSttService 等能力接入点。

对应源码:mateclaw-server/src/main/java/vip/mate/channel/feishu/FeishuChannelAdapter.java

这说明 MateClaw 不是只把 Web 聊天搬到 IM,而是在把 Agent 放进企业已经使用的工作流里。

8. Scheduler、Skills、MCP:运行时配套也补齐了

Scheduler 在 v1.4.0 合并了定时任务、事件触发器和运行历史。它不只是"定时跑一下",而是让 Agent 工作可以从人工对话扩展到自动触发。

Skill 市场也更像运行时能力库。v1.4.0 里有技能 curator、模板、导入、新建、生命周期分类等能力。

从产品角度看,这些页面可能不如 Goal 和子员工那么显眼,但它们决定了 MateClaw 能不能长期维护一个"员工系统":工具从哪里来、技能怎么老化、MCP 怎么连接、任务怎么触发。

源码视角:v1.4.0 为什么可以叫 Agent Runtime 版本

如果只看 UI,v1.4.0 可能像是一次大版本功能更新。但结合源码看,它更像一次 Runtime 能力补齐:

Runtime 能力 对应源码 说明
目标状态 GoalServiceImpl Goal 有状态机、预算、事件、审计
长任务进度 ProgressLedgerService / ProgressLedgerTool 进度落库,跨上下文裁剪保留
子员工协作 DelegateAgentTool / SubagentRegistry 同步、并行、异步、多层树
工具/技能披露 AgentGraphBuilder / McpServerService load_skillenable_tool、MCP tier
权限治理 RoleCapabilities / WorkspaceService 后端 capability 是权限事实源
工具安全 ToolExecutionExecutor / ToolGuard 执行前治理,审批后 replay
企业渠道 FeishuChannelAdapter 卡片、媒体、STT、渠道原生工具

所以这版的核心不是"功能列表更长",而是:Agent 开始拥有持续运行所需的状态、治理和协作结构。

升级注意

v1.4.0 对已有配置保持兼容。已有 agent、skill、wiki、channel、cron、workflow、trigger 不会因为升级被重置。

需要注意三个默认行为:

  1. 渐进式工具披露默认开启 :如果你的自动化依赖所有工具始终全量可见,可以设置 mateclaw.tools.disclosure.mode=legacy
  2. 飞书 media_download_enabled 默认开启:会下载入站文件/音视频,在意磁盘或隐私可以关闭。
  3. 技能 curator 默认开启:闲置技能会被老化,保守部署可以暂停。

部署上,服务端现在支持:

bash 复制代码
java -jar mateclaw-server-1.4.0.jar

总结

MateClaw v1.4.0 最重要的变化,是把"Agent 会调用工具"继续往前推进成"Agent 能持续交付任务"。

它会记目标,会更新进度,会找子员工,会按需打开工具,会受权限和审批约束,也能进入飞书这样的企业协作环境。

一句话:

v1.4.0 是 MateClaw 从 AI 助手走向企业 Agent Runtime 的关键版本。

相关链接:

相关推荐
knqiufan8 天前
PowerMem 记忆系统的遗忘设计,从神经元到代码工程
ai·agent·memory·agentic·powermem
qcx2317 天前
混合检索+重排序:当前 RAG 精度提升最成熟的工程路径
算法·ai·llm·agent·rag·agentic
阿里云大数据AI技术21 天前
千亿级 AI 搜索的效能实战:从混合检索到 Agentic RAG 的三年实战
人工智能·elasticsearch·阿里云·agentic·ai 搜索
花千树-0101 个月前
从 Claude Code 到 Codex:拆解 Agent Runtime 五层架构的新技术演进
ai编程·codex·ai agent·vibe coding·claude code·agent runtime
山顶夕景2 个月前
【MLLM】GraphWalker:Deepresearch用于图像生成
大模型·强化学习·图像生成·rl·agentic
Fzuim2 个月前
从CLI到分布式智能体:重新理解AI Agent的演进路径与工程现实
人工智能·分布式·ai·agent·agentic
AI2中文网2 个月前
AppInventor2 AI助手:美化界面 还是非常有用的!!
ai·ai编程·ai助手·appinventor·agentic·appinventor2·美化界面
星野云联AIoT技术洞察2 个月前
2026 年 MCP + MQTT:AI Agent 真正控制 IoT 设备的落地路径
数字孪生·ack·ai agent·物联网平台·agentic·mcp·命令服务