Superpowers:给 AI 编程 Agent 装上"工程化超能力"

Hi~大家好呀,我是清汤饺子。 前几天让 Claude Code 帮我写个小功能,它噼里啪啦一顿输出,代码倒是挺像那么回事。一跑,报错 40 个。

我盯着屏幕愣了三秒,然后开始一个个手动修。

事后复盘,问题不在 AI 写的代码烂,而在于------它太有热情了。拿到需求就开干,根本不问我"你想解决什么问题"、"这个场景下最优解是什么"。

这感觉就像招了一个「执行力超强但完全没有工程纪律」的 junior。

然后我发现了 Superpowers。

01 解决什么问题

AI Coding Agent 最大的通病,懂的都懂:

  • 拿到需求就开干:不等你确认,先肝为敬
  • 不写测试:代码写完自己都不知道写了啥
  • 代码像开盲盒:这次好使,下次不知道哪个版本就崩了

人类工程师有 TDD、有 code review、有设计评审,有一整套工程纪律来约束自己。但 AI Agent 呢?它只管输出,不管后果。

Superpowers 就是干这个的------给 AI Agent 装上一组技能卡,让它学会工程化的工作流

不是让它更聪明,是让它更有章法。

02 Superpowers 是什么

这是 Jesse Vincent(GitHub @obra)做的一个开源项目,全称是 Superpowers --- An agentic skills framework & software development methodology

翻译成人话:一套给 AI 编程 Agent 用的技能框架

它不是让你用更厉害的模型,而是让你的 AI Agent 具备一套工程化思维:

  • 写代码前先做设计评审
  • 先写测试再写实现
  • 任务拆解到 2-5 分钟一个
  • 子 Agent 并行执行 + 两阶段 review

支持 Claude Code、Cursor、Codex、OpenCode 和 Gemini,主流 AI 编程工具都能用。

03 这工作流是怎么跑起来的

第一步:brainstorming ------ 先别写代码,灵魂拷问一下

Superpowers 的第一条技能叫 brainstorming,触发时机是「写代码之前」。

当 AI 看到你要做新功能,它不会直接开干,而是反过来问你:

"你到底想解决什么问题?" "这个场景下有哪些边界情况?" "你觉得最优解是什么?"

我第一次用它做设计,它连着问了我 6 个问题才肯动笔。那感觉......像找了个 senior 在给我做 design review。

Socratic 追问,让 AI 先理解需求再动手。这治好了 AI "拿到需求就肝" 的毛病。

第二步:writing-plans ------ 任务拆解到 2-5 分钟

需求确认之后,进入 writing-plans 技能。

AI 会把整个功能拆成若干小任务,每个任务:

  • 精确到文件路径
  • 有完整的代码内容
  • 有验收标准

更关键的是:每个任务 2-5 分钟就能跑完

以前我让 AI 写整个功能,它容易迷失在中途。现在它把活儿拆成「傻瓜式操作手册」,就像给一个「执行力强但没耐心」的 junior 写了一份 2 分钟就能完成的小任务清单。

第三步:subagent-driven-development ------ 子 Agent 并行跑

计划就绪,主 Agent 调度 subagent-driven-development 技能。

它的核心是:

  1. 子 Agent 并行执行:每个任务交给独立的子 Agent 处理
  2. 两阶段 review:先检查规格是否合规,再检查代码质量
  3. 连续运行能力:实测 Claude 可以连续跑 2 小时不用管

简单说就是:你当老板,AI 们当工人。主 Agent 包工头负责分配任务、监督进度、质量把关。

第四步:TDD 红绿重构 ------ 先写测试这道坎

这是我觉得最有价值的部分:test-driven-development

核心流程就三步:

  1. RED:写一个注定失败的测试
  2. GREEN:写最少的代码让测试通过
  3. REFACTOR:重构优化

重点是:必须先写测试,再写实现,测试前的代码直接删掉

这治好了 AI "写完代码懒得测" 的毛病。以前我让 AI 写功能,它输出完就完事,根本不管测试。现在它被强制绑上了 TDD 的战车。

第五步:收尾工作 ------ finishing-a-development-branch

任务全部完成后,finishing-a-development-branch 技能接管:

  • 验证所有测试通过
  • 给出四个选项:merge / PR / 保留 / 丢弃
  • 自动清理 worktree

不需要你手动去处理分支清理,AI 会把收尾工作做完。

04 技能全景图

技能 触发时机 作用
brainstorming 写代码前 需求澄清,Socratic 追问
writing-plans 设计批准后 任务拆分,2-5min/任务
using-git-worktrees 设计批准后 创建独立分支,验证干净测试基线
verification-before-completion 调试完成后 验证问题真的修好了
subagent-driven-development 计划就绪 子 Agent 并行执行 + 两阶段 review
test-driven-development 实现中 强制红绿重构
systematic-debugging 调试时 4 阶段根因分析
requesting-code-review 任务间 按严重性报告问题
finishing-a-development-branch 任务完成 收尾 + 分支清理

这套技能的精妙之处在于:触发完全自动。你不需要手动调用,AI 会根据当前任务状态自动匹配技能。

就像给 AI 装了一堆「工程化本能」,遇到对应场景自动触发。

05 怎么装上

各平台安装方法:

Claude Code

bash 复制代码
# 方式一:官方 Claude 插件市场(推荐)
/plugin install superpowers@claude-plugins-official

# 方式二:社区 marketplace(需要先注册)
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace

Cursor

bash 复制代码
# 在 Agent chat 中
/add-plugin superpowers

Codex

ruby 复制代码
Fetch and follow instructions from https://raw.githubusercontent.com/obra/superpowers/refs/heads/main/.codex/INSTALL.md

安装大约 5 分钟,配上之后的感觉像是------给 AI 做了一个完整的入职培训。

06 真实感受

惊喜时刻

  • 项目节奏完全变了。以前我追着 AI 跑,现在是 AI 追着任务跑
  • Claude 真的能连续跑 2 小时不出岔子
  • TDD 闭环治好了我懒得写测试的毛病

崩溃时刻

  • 第一次用的时候它问太多问题(brainstorming 阶段),差点想卸载
  • 配置比想象中复杂,需要花时间理解每个技能的触发逻辑

适合的人

  • 有一定经验的开发者,懂 TDD、懂工程化的人用起来如虎添翼
  • 团队协作场景,AI 能承接更多的工程纪律

不适合的人

  • 纯新手可能觉得被束缚,不知道为什么要这么做
  • 小项目不值得折腾,简单功能直接让 AI 写反而更快

07 本质是什么

用了一圈下来,我觉得 Superpowers 的本质是:

不是让 AI 替代你,是让它成为更有章法的搭档。

它不是在提升 AI 的智商,而是在约束 AI 的行为------让它像人类工程师一样思考、像人类工程师一样工作。

以前我把活儿交给 AI,总是提心吊胆,不知道它会整出什么幺蛾子。现在有了 Superpowers 的工程化约束,我更愿意把任务交给 AI 了。

因为它不会再半夜给我埋雷。

08 技术原理

看完了 GitHub 仓库之后,我发现 Superpowers 的实现比"配置文件合集"要精妙得多。

SKILL.md:技能即文档

每个技能都是一个 .md 文件(Markdown),放在 skills/ 目录下。文件格式包含两部分:

Frontmatter(YAML 元信息)

yaml 复制代码
---
name: brainstorming
description: Use when [condition] - [what it does]
---

正文内容:技能的详细指令,告诉 AI 在什么场景下怎么做。

关键是 description 字段 ------这是 AI 自动发现和触发技能的依据。Codex/Claude Code 在每次任务执行前,会扫描 ~/.agents/skills/ 目录,根据 description 匹配当前上下文,自动激活对应技能。整个过程不需要你手动调用。

7 步接力:上游输出驱动下游输入

每一步的输出成为下一步的输入:

  • brainstorming 产出设计文档(human-approved)
  • using-git-worktrees 创建隔离分支环境
  • writing-plans 把设计拆成任务清单
  • subagent-driven-development 按任务执行 + 两阶段 review
  • test-driven-development 强制 TDD
  • requesting-code-review 任务间按严重性报告问题
  • finishing-a-development-branch 收尾

两阶段 Review:规格合规 → 代码质量

每个子 Agent 完成任务后,经历两关:

  1. 规格合规性审查:任务有没有按 plan 执行?有没有超出范围?
  2. 代码质量审查:代码本身写得怎么样?有没有明显 bug 或坏味道?

两关都过,才进入下一个任务。这治好了 AI "做多了或做歪了" 的问题。

TDD 强制闭环

test-driven-development 的核心规则:

  • RED:AI 必须先写一个注定失败的测试
  • GREEN:然后写最少的代码让测试通过
  • REFACTOR:最后重构优化

最狠的一条:测试写出来之前的代码直接删掉。AI 没有"先写实现后补测试"的选项。

哲学层:Process over guessing

README 里 Jesse Vincent 写了四条原则:

  • Test-Driven Development --- 先写测试,永远
  • Systematic over ad-hoc --- 系统化流程 > 猜测
  • Complexity reduction --- 简单性是首要目标
  • Evidence over claims --- 用验证说话,不要只靠感觉

本质就是:不要相信 AI 的直觉,要相信工程纪律

GitHub 仓库:github.com/obra/superp...


写在最后

Superpowers 这套技能框架,解决的不是 AI 能力不足的问题,而是 AI 行为不可控的问题。

如果你也在用 AI Coding Agent,感觉它"太热情但不靠谱",建议试试这套方法论。

当然,它不是银弹。工程纪律是给有工程经验的人用的,如果你本身对 TDD、代码审查这些概念不熟悉,Superpowers 可能会让你更困惑。

核心问题是:你愿不愿意花时间教会 AI 按你的方式工作?

这个问题没有标准答案,取决于你的项目规模和团队情况。


你在用 AI 编程工具吗?有什么"AI 疯狂输出但最后还是我来收拾烂摊子"的经历吗?欢迎在评论区聊聊,看看大家都有什么奇葩故事。

如果觉得有帮助,点个赞收藏一下,我会更有动力更新下一期。

也欢迎关注我的公众号「清汤饺子」,获取更多技术干货!

相关推荐
踩着两条虫2 小时前
AI驱动的Vue3应用开发平台 深入探究(十三):物料系统之区块与页面模板
前端·vue.js·人工智能·架构·系统架构
念何架构之路2 小时前
Go语言表达式的求值顺序
开发语言·后端·golang
zihao_tom2 小时前
Springboot-配置文件中敏感信息的加密:三种加密保护方法比较
java·spring boot·后端
weixin199701080162 小时前
《得物商品详情页前端性能优化实战》
前端·性能优化
.生产的驴2 小时前
1Panel实战|SpringColud微服务部署生产环境一键部署Docker+Nacos+MySQL 数据定时备份 控制台 安全高效易维护
服务器·后端·mysql·spring cloud·docker·微服务·信息可视化
帮我吧智能服务平台2 小时前
装备制造企业售后服务数字化:从成本中心到利润中心背景
java·前端·制造
qq_368019662 小时前
用 react 的react-syntax-highlighter 实现语法高亮、行号与多行错误行高亮
前端·react.js·前端框架
lbh2 小时前
从LLM到Agent的核心概念
前端·openai·ai编程
-Da-3 小时前
【操作系统学习日记】并发编程中的竞态条件与同步机制:互斥锁与信号量
java·服务器·javascript·数据库·系统架构