用 hooks 机制锚定 skills 工作流

source: hqz.is-a.dev/articles/us...

1. 问题:Skills 工作流的不确定性

我把软件开发中的一些典型场景抽象成工作流 ,并用 Claude Code(下文简称 CC)的 skills 机制实现了自动化------我只需要负责"触发"和"验收",剩下的重复性工作全部交给 agent。

然而,前一阵子我一直被一个问题困扰:

明明我已经在 skills 中明确定义了工作流状态间的流转细节和规则,但在多次测试中,CC 偶尔仍会忘记规则,导致工作流被破坏。

这种不确定性让我很不舒服------不仅因为失败本身,也因为浪费了大量时间和 tokens。

于是我开始重新思考 skills 到底意味着什么。

2. 归因:Skills 的能力边界

2.1 被忽视的消极面

在技术社区里可以看到很多关于 skills 的讨论,比如:skills 能够教会 agent 使用工具连接外部世界;相比于 MCP 注意力更集中、更节省 tokens 等。

Anthropic 以及 OpenAI 也是一样,在描述自家 skills 机制时都在强调它的多种优势。

对工程师而言,评估一项新技术不能只看到它的积极面,它的消极面对于工程化而言同样重要。

2.2 Skills 的执行取决于模型注意力

我想我现在就遇到了 skills 的短板造成的问题。这里可以明确一个事实:

Skills 并没有单独的机制来保证工作流中的每一步都按规则执行------它的执行效果完全取决于模型的智力(或者注意力)。

2.3 高自由度任务 vs 低自由度任务

为了把问题说清楚,这里引入两个概念来区分不同类型的 agent 任务:

  • 高自由度任务:目标明确但路径灵活,依赖 agent 的推理能力解决单步内部问题(例如:写一个函数、分析一段日志)。

  • 低自由度任务:状态明确、流程明确、规则明确,需要严格的"重复一致性"(例如:code review、提交 PR、发布流程)。

对低自由度任务而言,skills 的执行效果会随着模型降智而放飞自我,这是不可接受的。

而一个完整的工作流任务,往往同时包含两类子任务------既需要利用 agent 的"高自由度"推理能力解决单个流程内部的复杂问题,又需要处理好"低自由度"的流程之间转换规则。

3. 方案:用 hooks 锚定状态流转

3.1 Hooks 与 Skills 的机制差异

幸运的是,agent 框架的设计者为我们留了另一个工具用于处理"低自由度任务":hooks

顾名思义,hooks 机制可以让我们定义一些"钩子",这些钩子会在工作流中的特定位置被调用,从而保证工作流中的每一步都按照规则执行。

区别于 skills 的语义化驱动(由 agent 进行自然语言理解),hooks 源生于 agent 内部,由编排层的策略机制驱动,可以添加在 agent 运行过程中的多个节点上。因此它的特点就是稳定、可靠、一定会触发

两者的差别可以用下图直观对比:

flowchart LR subgraph Skills["Skills:语义化驱动"] S1[Agent 读取指令] --> S2{模型理解规则} S2 -->|注意力充足| S3[正确执行] S2 -->|注意力漂移| S4[破坏工作流] end subgraph Hooks["Hooks:编排层驱动"] H1[Agent 触发事件] --> H2[编排层拦截] H2 --> H3[执行裁决逻辑] H3 --> H4[一定触发] end

3.2 基于 FSM 的 hooks 改造流程

于是我尝试用 hooks 机制来改造原本的 skills 工作流,具体做法分为四步:

  • Step 1 · 抽象 FSM :把原本 skills 中的所有状态节点抽象成有限状态机(FSM),为每个状态编号,定义清楚状态的描述、允许流转的下一个状态以及是否允许跳过当前阶段等。

  • 产物:fsm-rules.json静态规则,持久化到 skills 中)

  • Step 2 · 定义运行时变量:用一个文件表示"当前状态",skills 运行时创建、结束后销毁。

  • 产物:fsm-current.json运行时状态

  • Step 3 · 编写 hook 裁决逻辑:hook 被触发时,比对上述两个 JSON 文件,做出**"下一个状态是否能够流转"**的裁决。

  • Step 4 · 配置 hook 触发点:在 agent 配置文件中定义 hooks 的触发条件,例如"在每次调用工具前触发"。

改造后的工作流在每次工具调用前都会经过 hook 拦截并裁决:

flowchart TD Start((Agent 触发工具调用)) Hook[/Hook 拦截/] LoadRule[加载 FSM 规则
fsm-rules.json] LoadCur[读取运行时当前状态
fsm-current.json] Judge{下一状态
是否被允许?} Allow[放行工具调用] Deny[阻断并报错] Update[更新运行时状态] Start --> Hook Hook --> LoadRule Hook --> LoadCur LoadRule --> Judge LoadCur --> Judge Judge -- Yes --> Allow Judge -- No --> Deny Allow --> Update

3.3 实践效果

这个机制实现上并不复杂,但在稳定性上带来了质变 ------因为 hooks 的触发条件是完全可控的,不会像 skills 那样受到模型智力(或注意力)的影响。

在后来两周的实验中,再也没有出现过 agent 破坏工作流的情况。

4. Takeaway

最后留几条在实践中的经验总结:

  • 找到"低自由度任务":一旦任务具有状态明确、流程明确、规则明确的特征,就应该把约束下沉到 hooks 层,而不是指望 skills 自己约束自己。

  • Skills 负责语义,Hooks 负责约束:前者利用模型的理解力处理开放问题,后者利用编排层的确定性守住规则红线,两者互补而非替代。

  • "静态规则 + 运行时状态"分离fsm-rules.json 只读、fsm-current.json 可写,职责清晰,便于 debug 和复用。

相关推荐
码农的AI客栈2 小时前
Hermes Agent的多Agent配置指南【喂饭级教程】
agent·ai编程
DigitalOcean2 小时前
无封号焦虑!Claude Code 官方插件 +VS Code ,稳定接入的配置指南
agent·claude
星浩AI2 小时前
手把手教你用飞书远程指挥 Claude Code 干活[保姆级教程]
agent·claude·vibecoding
李兆龙的博客3 小时前
从一到无穷大 #69 Mem0 的接口与数据流是怎么设计的
人工智能·agent
deephub3 小时前
为生产级 AI Agent 构建持久化记忆:五阶段流水线与四种设计模式
人工智能·大语言模型·agent·记忆
求知也求真佳3 小时前
S03|待办写入:让 AI 不再走一步忘一步,多步任务不再跑偏
开发语言·agent
维元码簿3 小时前
Claude Code 深度拆解:上下文里有什么——Prompt Cache 机制
ai·agent·claude code·ai coding
维元码簿3 小时前
Claude Code 深度拆解:上下文里有什么——System Prompt 工程
ai·agent·claude code·ai coding