从埋点需求到规则资产：Hermes Agent 重构得物数仓工作流

在埋点和指标需求里，最消耗数据承接方的往往是把分散的信息重新拼起来：需求文档里的动作到底要不要采集，历史上有没有类似点位，指标口径有没有被下游使用，新增字段要改哪几层表，发布前又该由谁确认。我们选择Hermes Agent而不是OpenClaw是因为它具备持续在线、持久记忆和技能沉淀能力。对数据团队来说，下面几个原生能力正好对准了这类流程痛点：

分层持久记忆：短期会话/中期交互/长期知识/技能库四层结构，本地SQLite+FTS5全文检索。"关掉窗口就失忆"，在需要反复回溯历史口径的数仓场景是不可接受的；
技能自动沉淀：任务完成后能把经验提炼成Markdown技能文档并持续优化。这正是"专家经验资产化"的框架级支撑，本文反复出现的"规则包"就构建在这套技能机制之上；
多平台统一网关：原生接入飞书、钉钉、企业微信等协作平台，智能体直接嵌进团队已有的沟通现场，不用另建工作台；
工具与扩展生态：终端执行、定时任务、浏览器自动化等内置工具，企业内部系统经MCP命令封装稳定接入。

在这套框架之上，我们把一次埋点需求承接拆成四个可追踪的工程构件：工作区（每个需求独立空间，集中存放需求文档、历史讨论、评审结论和交付产物）、看板（状态机流转：进入、设计、预演、评审、交付，每步有责任人）、规则 + 长期记忆（把"老同学才知道"的判断写成可执行检查清单）、结构化工具接口 + 预演 + 人工确认点（高风险动作走结构化接口，写入生产前先预演、再等人放行）。

图：Hermes Agent 能力底座与 OpenClaw 对比

图：Hermes Agent 工作流主线

一、Hermes Agent 让流程可控

如果让AI直接给最终结论，确实会很快，但这种快并不让人放心。因为数仓链路里的错误通常是依据没找全、假设没说清、风险没暴露，最后带着一个"看起来完整"的方案进入评审或生产。

所以Hermes Agent的边界是把问题整理到足够可判断。 它负责把材料、历史、候选方案、系统预演和风险证据组织起来；人负责业务语义、指标口径、敏感字段、下游影响和生产放行。

图：Hermes Agent 的能力边界与人工确认线

Hermes Agent 真正承担的是判断前的工程化准备

在这条链路里，Hermes Agent 更像一个流程编排者，而不是一个埋点生成器。它把一次需求拆成几件能被检查、能被追踪、能被恢复的事，所做的准备如下图所示：

图：Hermes Agent 判断前准备四步

要从流程侧切入：这不是弱化数据承接方的判断，恰恰相反，是把数据承接方从反复翻材料、追状态、补上下文里释放出来，让人把精力放在真正需要负责的地方：口径能不能成立，风险能不能接受，生产动作能不能放行。

图：为什么先从流程侧切入与风险边界

边界说清楚后，选型的重点不在 Agent 数量，而在上下文、规则和确认点能不能在同一条链路里稳定运转。

二、用单 Agent 串流程，用能力模块沉淀可复用能力

这一类需求如果只靠一段提示词，很快会遇到两个问题：一是同一个需求换个问法，输出结构和检查重点就会漂；二是模型可以写出"看起来完整"的方案，却说不清它读了哪些事实、调用了哪些系统、哪些动作必须等人确认。所以我们没有把能力拆成一组互相独立的智能体，而是选择"单Agent编排+多能力模块+看板确认点"：Hermes Agent 保持统一上下文，负责调度阶段；能力模块承接稳定动作，负责把工具调用、输入约束、输出产物和停顿条件固化下来。

图：Hermes Agent 选型：单 Agent 编排 + 多能力模块

固化流程契约

选型确定以后，要固化的是每个能力模块的输入、动作边界、输出产物、失败处理和经验回写。只有这些契约稳定，Hermes Agent才不会因为提示词换一种说法就改变检查重点。

图：能力模块不是工具清单，而是流程契约

可复用能力模块设计：从埋点链路迁移到更多数据研发场景

这些能力模块不是只服务一次埋点需求，而是把素材采集、历史检索、变更预演、发布确认、经验沉淀抽成可复用的流程模块。换事实源和工具接口后，同一套机制也能迁移到指标发布、配置变更和数据质量排查，可复用的SKILL就是这套机制的核心载体。

图：可复用能力模块设计地图

这一选择把 Hermes Agent 的长期记忆和能力模块机制变成团队可复用的作业制度，也为工作区、看板、预演和确认点提供统一上下文。

三、总体工作流：从一次对话变成一条可回放链路

图：Hermes Agent 埋点需求端到端工作流

下面用一个场景串联完整链路：业务希望稳定查看"昨天各体裁发布量"。如果只让模型直接写 SQL，很容易把物理字段、业务发生日期和默认过滤混在一起，Hermes Agent 的做法是先固化事实，再预演风险，最后把需要人判断的点推到看板确认。

全链路把需求入口、工作区、规则包、系统预演、人工确认和交付归档串在一起；会议纪要则作为协作语境进入需求上下文，补充已确认事实、责任人和待澄清问题。

图：会议纪要进入需求上下文的链路

图：周期性同步需求并写入工作看板

图：任务看板承接需求状态、推进和人工介入

图：工作区保留的事实源

四、能力底座：把规则、上下文和命令资产化

这一节聚焦"什么值得沉淀"。埋点自动化真正难的是把历史口径、下游影响、人工确认和生产状态拆成可复用资产：规则包回答"怎么判断"，工作区回答"依据在哪里"，看板回答"卡在哪里"，结构化工具接口回答"系统状态是否验证过"。

规则资产化：先决定什么值得记住

这里的关键不是让 Hermes Agent 记得更多，而是把材料分层：临时信息留在本轮任务，能复用的做法沉进规则包，需要人工把关的内容进入治理记忆。这样下一次相似需求到来时，系统先补证据、提醒风险，而不是让数据承接方从头解释。

图：规则资产化与长期记忆闭环

协作可见：让 AI 不在后台默默跑完

规则资产只有进入协作流程才有价值。看板负责暴露阶段、阻断项和责任人，飞书保留澄清、驳回和确认语境，工作区承接证据和产物；三者合起来，才能让人知道AI做到了哪一步、还缺什么、哪里必须停下来等确认。

图：看板 + 飞书让 AI 每一步可见

上下文与事实源：下一任务读什么，最终相信什么

上下文传递不能靠"多塞材料"解决，而是把任务背景、阶段结论、人工反馈和运行元数据分开保存。与此同时，聊天只能补语境，工作区负责留证，系统预演负责验证，生产系统才是最终事实源。

图：上下文传递与事实源边界

结构化工具接口：把生产动作变成可验证接口

当智能体接近生产系统时，最不应该依赖页面识别和临场点击。结构化工具接口的作用，是把查询、绑定、发布、验证这些动作包装成参数明确、返回结构化、过程可审计的接口；越靠近写入，越要先预演、再确认、最后留痕。

图：结构化工具接口把生产动作变成可验证接口

这四类资产合在一起，才让 Hermes Agent 从"会回答"变成"能交接"。越靠近生产，越要把资产和治理连起来：规则给出判断边界，命令提供验证证据，看板承接人工确认。

五、风险治理：可验证执行、人工确认点与审计留痕

Hermes Agent越靠近生产链路，越不能只追求"自动执行"。上线前只看三类硬证据：事实来源是否可信，系统预演是否通过，责任人是否已经确认。

图：Hermes Agent 的能力边界与人工确认线

上线前只过三道门：事实源门、预演门、责任门。任何一道门缺证据，Hermes Agent 都只能停在候选方案或待确认状态，不能继续推进生产写入。

治理的目标不是让数据承接方把系统做过的事再手工复查，而是让系统在关键位置停下来，把证据、预演结果和责任人摆到台面上。人的精力应该留给真正的判断点：口径要不要调整，风险能不能接受，生产动作能不能放行。

六、结论

Hermes Agent值得放大的是可回放、可确认、可复用的工作流能力。当前链路已经围绕四件事形成主线：跑通需求流转，前置风险拦截，沉淀规则资产，让数据承接方把精力放到口径裁决和生产边界上。

下一步的重点不是继续堆更多自动化动作，而是把证据口径跑实：用连续样本证明准备时间、交付周期、评审通过率和返工原因的变化。只有当这些指标和看板、日志、确认记录一一对应时，这条链路才真正具备扩大使用的工程基础。

图：Hermes Agent 规模化落地路径

往期回顾

1.让 Claude Code 拥有自我进化和记忆系统｜得物技术

2.用 LLM Agent 重构告警排查流程｜得物技术

3.HorizonVault 技术深潜：如何在 HDD 上做出 100GB/s+ 级大吞吐分布式存储｜得物技术

4.Claude Code Harness 工程：数仓侧落地方案｜得物技术

5.BP Claw 破解 AI 编码输入难题 ------FlinkSpec 需求智能化实践｜得物技术

文 /小诘、博温

关注得物技术，每周四更新技术干货

要是觉得文章对你有帮助的话，欢迎评论转发点赞～

未经得物技术许可严禁转载，否则依法追究法律责任。