AI工作流不按要求执行问题的排查与解决

常见原因及应对

1. Token 不足 / 输出被截断

表现: Skill 执行到一半突然停下,或者只执行了前半部分。

原因: 模型输出达到 token 限制,导致截断。

解决:

✅ 缩短 Skill 指令,分步执行

✅ 在 Workflow 中拆分多个短任务

✅ 使用 sessions_spawn 让子 Agent 独立执行各阶段

✅ 降低模型复杂度要求

2. Skill 指令不够清晰

表现: 模型"选择性执行",挑简单的做,难的跳过。

原因: Skill 描述模糊,没有明确强制要求。

解决:

❌ 模糊指令:"分析一下这只股票"

✅ 清晰指令:"按以下步骤分析:

  1. 获取最新股价和PE值

  2. 获取近3年营收增长率

  3. 对比行业平均水平

  4. 输出结论(买入/持有/卖出)和理由

每一步都必须执行,不能跳过"

3. 模型推理能力不足

表现: 复杂多步骤任务只做第一步,后面的"忘了"。

原因: 上下文太长,主要任务被稀释。

解决:

✅ 使用 update_plan 明确当前进度

✅ 每阶段结束时总结状态再进入下一阶段

✅ 使用 thinking=on 开启推理模式

✅ 拆分为多个独立 Agent 任务

4. 工具执行失败但静默忽略

表现: 模型说"已执行"但实际没有结果。

原因: web_search、exec 等工具超时或报错,但模型没有上报。

解决:

✅ 指令中明确要求:"如果任何工具调用失败,必须明确报告错误"

✅ 检查工具返回的错误信息

✅ 增加超时时间

✅ 使用 sessions_spawn 隔离执行,避免主上下文污染

5. 任务编排问题

表现: 多个 Skill 之间顺序混乱,或并行执行时出问题。

原因: Workflow 步骤之间没有清晰的状态传递。

解决:

✅ 确保每个阶段有明确的输入/输出约定

✅ 使用 write 工具把中间结果写入文件

✅ 下一阶段明确读取上一阶段的输出文件

✅ 添加验证节点:"确认上一步输出存在再继续"

实战建议:让工作流更听话

📋 Plan + 验证法

如现在的任务是:

🔧 分而治之

不要让一个 Agent 做所有事:

Workflow:

任务1 → sessions_spawn(独立Agent, 执行Skill A)

任务2 → sessions_spawn(独立Agent, 执行Skill B)

汇总 → 主Agent读取A+B的结果进行整合

📝 强制报告格式

在 Skill 指令中要求:

执行完毕后,必须按以下格式报告:

  • 执行状态:成功/失败/部分成功

  • 实际输出:具体内容

  • 异常信息:如有

  • 建议:是否需要人工介入

快速排查清单

检查项 操作
Token 是否耗尽 检查模型输出是否被截断
指令是否清晰 用 ✅ 的"清晰指令"模板重新描述
工具是否正常 单独测试每个工具调用
上下文是否过长 拆分任务,减少历史依赖
模型是否"跳步" 添加强制验证节点
并发是否冲突 改为串行执行,或隔离到子Agent

一句话总结

工作流不听话的主要原因:指令模糊、token不足、工具失败被忽略。核心解法:指令具体化、执行分阶段、结果强制验证。