oh-my-agent — 面向实战的多 AI IDE 智能体调控框架

让智能体"做一个 TODO 应用",它确实会做出点什么。问题在于,它经常做出来的东西驴唇不对马嘴,跑出预定范围,还反复犯同样的错误。

为了解决这些问题,早期出现了 AGENTS.md,近来又有了 Skills 这类结构化方案。但看看实际分享出来的 Skills,几个通病很明显:

最关键的库版本信息缺失。 角色描述止步于"You are a Senior engineer"之类的空话。 几个关键词就能讲清的内容,偏要写成长篇大论,白白浪费 token。

结果就是,模型既不能好好遵循这些 Skills,上下文也白白耗掉了,时间一长就变成了没人想打开的死代码。

[思路]

oh-my-agent 想用流程而非提示词来解决这个问题。智能体出错时,不是简单地说一句"重来",而是记录它为什么出错,并在下一次执行中加以改进。

核心机制是 Clarification Debt(CD)计分。当智能体误解需求或越出范围时,会累积分数:

  • clarify: +10 --- 简单的确认提问
  • correct: +25 --- 因误解意图而修正方向
  • redo: +40 --- 因越界而回滚重来
  • 未确认 Charter 就动手: +15
  • 修改了允许范围外的文件: +20
  • 重复同一错误: x1.5 倍率

超过 50 分,必须编写 Root Cause Analysis(RCA);超过 80 分,会话直接中断。总结出的经验会沉淀到 lessons-learned.md,从下一次会话起立即生效。提示词写得再简单,流程也能帮你兜住。

除此之外,为了防止智能体自行其是,还设有几个通用协议:

Clarification Protocol --- 将需求模糊度分为 LOW / MEDIUM / HIGH。LOW 直接推进,MEDIUM 给出选项,HIGH 停下来先把事情说清楚。

Difficulty Guide --- 将任务划分为 Simple / Medium / Complex,按需调整协议深度。

Context Budget --- 按模型设定 token 预算,减少不必要的上下文开销。

这种思路与 OpenAI 提出的 Harness Engineering 一脉相承。用好智能体,不是一句提示词能解决的,关键在于你用什么样的结构去管控它。

[项目结构]

oh-my-agent 在项目目录内统一管理这些内容。

.agents/ = SSOT --- 技能、工作流、配置全部放在 .agents/ 目录下,作为唯一可信数据源,不绑定任何特定 IDE。

基于角色的智能体团队 --- 基础角色包括 PM、QA、Frontend、Backend、Mobile、Debug,本次新增了 DB Agent 和 TF Infra Agent。

  • DB Agent:SQL / NoSQL / Vector DB 建模,含 ISO 27001 安全建议
  • TF Infra Agent:多云 Terraform,OPA / Sentinel 策略,ISO 42000 系列管控指南

以工作流为中心的编排 --- 规划、评审、调试、并行执行构成基本流程。新增的 /brainstorm 工作流在写代码之前先做设计探索:代码库分析 → 澄清提问 → 方案建议 → 用户确认 → 保存设计文档,之后衔接 /plan → 实现。

[两种编排模式]

/coordinate 追求速度------快速迭代,出了问题再修。PM 拆解任务、调度智能体,QA 做一轮评审。遇到 CRITICAL/HIGH 级别问题就重跑该任务,整体是一个轻量高效的 7 步循环。

/ultrawork 则强调质量把关。分为 PLAN → IMPL → VERIFY → REFINE → SHIP 五个阶段,每个阶段都有门禁,过不了就不能往下走。17 个步骤中有 11 个是评审;REFINE 阶段还会做文件拆分、去重、副作用分析和死代码清理。

看起来可能有些过头,但编程的抽象层级从机器语言到高级语言、再到自然语言一路攀升,验证只会变得越来越重要------相信大家对此不会有异议。

[项目扩展背景]

一个月前,这个项目以 oh-my-ag 的名字亮相,当时是 Antigravity 专属的编排器。但这段时间里,多个 AI IDE 开始把 .agents/skills/ 作为项目技能路径,继续绑定单一 IDE 已经没有意义。于是扩展为通用调控框架,更名为 oh-my-agent。

[快速开始]

perl 复制代码
curl -fsSL https://raw.githubusercontent.com/first-fluke/oh-my-agent/main/cli/install.sh | bash

支持 Antigravity、Claude Code、Codex CLI、Cursor 等主流 AI IDE。

如果你已经在用 AI IDE,不妨试一试。说到底,开发者的目标是同时把控 QCD(Quality, Cost, Delivery)。智能体开发也不例外------oh-my-agent 就是带着这个信念做出来的。

🔗 GitHub: first-fluke/oh-my-agent

相关推荐
星浩AI1 天前
OpenHuman 对比 OpenClaw、Hermes Agent
人工智能·后端·agent
QC·Rex1 天前
12-Factor Agents:2026 年生产级 LLM 软件工程方法论深度解析
agent
花椒技术1 天前
低代码平台接入 Agent 后,我们踩到的组件、上下文和追问坑
前端·人工智能·agent
阿里云云原生1 天前
【5.29北京】智驭运维,Agentic Ops可观测工作坊限时报名!
云原生·agent
传说故事1 天前
【论文阅读】RoboAgent: 通过语义增强和动作分块实现机器人操作的泛化与效率
论文阅读·机器人·agent
甲维斯1 天前
Antigravity新系列初体验,Codex直呼内行!
人工智能·agent
OpenBayes2 天前
外语、方言、少数民族语言全覆盖:Hy-MT1.5 支持 1056 个翻译方向;MIT 联合发布 MathNet:涵盖 2.7 万道奥数真题的多模态数学推理基准
人工智能·深度学习·ai·agent
传说故事2 天前
【论文阅读】Continual Harness: Online Adaptation for Self-Improving Foundation Agents
论文阅读·人工智能·agent
AI小老六2 天前
Agent Runtime 九个关键设计:状态外化、上下文压缩与多智能体协同
架构·agent
火山引擎开发者社区2 天前
ArkClaw AI 持仓哨兵 —— 8 句话训练你的专属盯股助手
人工智能·agent