gstack & Superpowers 使用手册
两份 AI 工程方法论,一个完整开发工作流
适用平台:Claude Code / Codex CLI / Cursor / Gemini CLI / OpenCode
目录
- [Part 1:gstack --- 虚拟工程团队](#Part 1:gstack — 虚拟工程团队)
- [Part 2:Superpowers --- AI 工程方法论](#Part 2:Superpowers — AI 工程方法论)
- [Part 3:gstack + Superpowers 协同使用](#Part 3:gstack + Superpowers 协同使用)
- [附录 A:官方仓库与文档](#附录 A:官方仓库与文档)
- [附录 B:网络教程与文章](#附录 B:网络教程与文章)
Part 1:gstack --- 虚拟工程团队
1.1 概述
gstack 是 Y Combinator CEO Garry Tan 创建的开源(MIT)Claude Code 技能集合。它将 Claude Code 从一个通用 AI 助手转变为一支由 23+ 专家角色和 8 个强力工具组成的虚拟工程团队。
核心理念
复制代码
思考 → 规划 → 构建 → 审查 → 测试 → 交付 → 反思
(Think → Plan → Build → Review → Test → Ship → Reflect)
每个环节的输出是下一个环节的输入,确保上下文不丢失,不遗漏任何细节。Garry Tan 报告使用此工作流每天可产出 10,000--20,000 行可用代码,其中约 35% 是测试代码。
1.2 安装
前提条件
- Claude Code(或其他支持的 AI 编程代理)
- Git
- Bun v1.0+
- Node.js(Windows 平台需要)
全局安装(Claude Code)
bash
复制代码
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack && ./setup
多代理安装
bash
复制代码
# OpenAI Codex CLI
git clone https://github.com/garrytan/gstack.git ~/.codex/skills/gstack
cd ~/.codex/skills/gstack && ./setup --host codex
# 自动检测所有已安装代理
git clone https://github.com/garrytan/gstack.git ~/gstack
cd ~/gstack && ./setup --host auto
升级 gstack
bash
复制代码
cd ~/.claude/skills/gstack && git fetch origin && git reset --hard origin/main && bash ./setup
或使用内置命令:/gstack-upgrade
1.3 全部技能参考
规划与策略(Pre-Development)
| 命令 |
角色 |
功能说明 |
/office-hours |
YC 合伙人 |
6 个强制问题重构产品想法,生成设计文档 |
/plan-ceo-review |
CEO/创始人 |
四种模式(扩展/选择性扩展/维持范围/缩减)找到 10 星产品 |
/plan-eng-review |
工程经理 |
锁定架构、数据流图、状态机、边界情况、测试矩阵、错误路径 |
/plan-design-review |
高级设计师 |
0-10 分评估每个设计维度,AI 痕迹检测 |
/plan-devex-review |
DX 负责人 |
探索开发者角色、基准 TTHW、设计魔法时刻 |
/plan-tune |
调优专家 |
自调问题敏感度(从不询问/始终询问/有条件询问) |
/autoplan |
自动审查 |
自动运行 CEO→设计→工程→DX 审查流水线 |
/design-consultation |
设计合伙人 |
从零构建完整设计系统 |
实现与审查(Implementation & Review)
| 命令 |
角色 |
功能说明 |
/review |
高级工程师 |
预合并 PR 审查,找出 CI 通过但生产会暴露的 Bug,自动修复 |
/codex |
第二意见 |
通过 OpenAI Codex CLI 进行跨模型代码审查(通过/不通过/对抗/咨询) |
/investigate |
调试专家 |
系统化根因调试,遵循"不调查不修复"铁律 |
/design-review |
设计师 |
80 项现场视觉审计 + 修复循环 |
/design-shotgun |
设计师 |
生成 4-6 个 AI 设计变体,对比面板,反馈迭代 |
/design-html |
前端开发 |
生成生产级 HTML/CSS,30KB 零依赖 |
/devex-review |
DX 审计 |
实测入职流程、TTHW 计时、错误截图 |
测试与 QA(Testing & QA)
| 命令 |
角色 |
功能说明 |
/qa |
QA 负责人 |
真实 Chromium 浏览器测试,发现并修复 Bug,生成回归测试 |
/qa-only |
QA 报告者 |
同上但只生成 Bug 报告,不修改代码 |
/browse |
浏览器自动化 |
无头 Chromium 浏览器(Playwright 驱动),~100ms/命令 |
/setup-browser-cookies |
会话管理 |
从 Chrome/Arc/Brave/Edge 导入 cookies 进行认证测试 |
/benchmark |
性能工程师 |
性能回归检测(页面加载时间、Core Web Vitals、资源大小) |
安全(Security)
| 命令 |
角色 |
功能说明 |
/cso |
首席安全官 |
OWASP Top 10 + STRIDE 威胁建模,每日(8/10 置信度)或全量模式 |
交付与部署(Ship & Deploy)
| 命令 |
角色 |
功能说明 |
/ship |
发布工程师 |
同步主分支、运行测试、审计覆盖率、推送、创建 PR |
/land-and-deploy |
部署工程师 |
合并 PR、等待 CI、部署、验证生产健康状态 |
/canary |
SRE |
部署后监控循环(控制台错误、性能回归、页面故障) |
/setup-deploy |
部署配置 |
一次性部署配置检测(Fly.io, Render, Vercel 等) |
/document-release |
技术文档 |
更新所有项目文档以匹配发布内容 |
/document-generate |
文档生成 |
从代码生成遗失的 Diataxis 文档 |
数据采集(Scraping)
| 命令 |
角色 |
功能说明 |
/scrape |
数据采集 |
从网页提取数据,首次用 browse 原型,后续用固化脚本(~200ms) |
/skillify |
脚本固化 |
将最近成功的 /scrape 固化到永久浏览器技能 |
运维与记忆(Operational & Memory)
| 命令 |
角色 |
功能说明 |
/learn |
知识管理 |
管理跨会话记忆:审查、搜索、修剪、导出项目模式 |
/retro |
回顾 |
周工程回顾,按人分解、交付记录、测试健康趋势 |
/health |
代码健康 |
代码质量仪表盘:类型检查、Linter、测试、死代码 |
/context-save |
上下文保存 |
保存工作上下文供后续恢复 |
/context-restore |
上下文恢复 |
从保存的上下文恢复 |
/setup-gbrain |
GBrain 设置 |
设置 gbrain 持久记忆 |
/sync-gbrain |
GBrain 同步 |
将 gbrain 与仓库保持同步 |
安全防护(Safety)
| 命令 |
功能说明 |
/careful |
破坏性命令前警告(rm -rf, DROP TABLE, force-push) |
/freeze |
锁定编辑到一个目录,硬性阻止 |
/guard |
同时启动 /careful + /freeze |
/unfreeze |
移除 /freeze 限制 |
工具类
| 命令 |
功能说明 |
/browse |
无头 Chromium 浏览器(导航、点击、填表、截图、验证) |
/open-gstack-browser |
启动 GStack 浏览器(侧边栏、反机器人隐身、自动模型路由) |
/pair-agent |
配对远程 AI 代理与浏览器 |
/benchmark-models |
跨模型基准测试:Claude vs GPT vs Gemini |
/make-pdf |
Markdown 转出版质量 PDF |
/gstack-upgrade |
自升级到最新版本 |
1.4 浏览器命令速查(browse)
浏览器(基于 Playwright/Chromium)提供 80+ 命令:
| 类别 |
命令 |
| 导航 |
goto, back, forward, reload, url |
| 读取 |
html, text, data, links, forms, media, accessibility, snapshot |
| 交互 |
click, fill, select, type, press, hover, scroll, upload, wait |
| 视觉 |
screenshot, prettyscreenshot, responsive, diff, pdf |
| 检查 |
attrs, css, js, eval, console, network, perf, cookies, storage, cdp |
| 标签页 |
tabs, newtab, closetab, tab, tab-each |
| 服务器 |
connect, disconnect, handoff, resume, restart, stop, status, state, focus |
| 元命令 |
chain, skill, domain-skill, inbox, frame, watch |
| 提取 |
archive, download, scrape |
1.5 典型工作流示例
bash
复制代码
# 1. 头脑风暴
> /office-hours
"我想做一个日历每日简报应用"
Claude 重新定义:"你实际上在做个人首席 AI 助手"
→ 生成设计文档
# 2. CEO 审查
> /plan-ceo-review
挑战范围,找到明天就能交付的最小可行方案
# 3. 工程规划
> /plan-eng-review
ASCII 架构图、数据流、错误路径、测试矩阵
# 4. 实现
> [Claude 在约 8 分钟内编写 2,400 行代码,跨越 11 个文件]
# 5. 代码审查
> /review
自动修复 2 个问题,标记 1 个竞态条件
# 6. QA 测试
> /qa https://staging.myapp.com
打开真实浏览器,点击完整流程,发现并修复 Bug
# 7. 交付
> /ship
所有测试通过,覆盖率已审计,PR 已创建
1.6 并行工作:Conductor 模式
gstack 的核心突破功能:可以同时运行 10--15 个并行 Sprint --- 不同功能、不同分支、不同 Claude Code 会话 --- 全部在独立工作空间中相互隔离。这是实现 10K+ LOC/天生产力的关键。
1.7 使用原则
- 不要跳过角色:价值在于结构化思考,而非仅代码输出
- 顺序串联角色:每个角色的输出是下一个角色的上下文
- 自定义 Markdown 文件:团队应调整命令以适应自身规范
- 测试一切 :
/ship 会在缺少测试框架时自动引导构建
- 版本管理你的技能:把技能文件视为代码
Part 2:Superpowers --- AI 工程方法论
2.1 概述
Superpowers 是 Jesse Vincent (obra) 创建的 AI 代理技能框架和软件开发方法论。它是一套基础技能集合,教授 Claude Code(及其他 AI 代理)如何遵循严谨的工程规范。
核心理念
- 测试驱动开发 --- 始终先写测试
- 系统性而非临时性 --- 过程优于猜测
- 降低复杂度 --- 简洁为首要目标
- 证据优于声明 --- 在声明成功之前先验证
2.2 安装
通过官方市场安装(推荐)
复制代码
/plugin install superpowers@claude-plugins-official
通过 Superpowers 市场安装
复制代码
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
2.3 全部 14 项技能
| 技能 |
功能说明 |
using-superpowers |
入口技能 --- 在任何操作前检查是否有适用的技能。核心规则:即使只有 1% 的概率适用,也必须先调用技能 |
核心工作流(7 阶段)
| 阶段 |
技能 |
功能说明 |
| 1 |
brainstorming |
苏格拉底式设计细化 --- 写代码前厘清需求和设计 |
| 2 |
using-git-worktrees |
创建独立工作空间(Git Worktree),提供干净的测试基线 |
| 3 |
writing-plans |
将工作分解为可逐项完成的 TDD 任务(每个 2--5 分钟) |
| 4 |
subagent-driven-development / executing-plans |
每个任务派遣新的子代理,配合两阶段审查 |
| 5 |
test-driven-development |
严格的 RED-GREEN-REFACTOR --- 没有失败测试前不写任何生产代码 |
| 6 |
requesting-code-review / receiving-code-review |
任务间对照计划进行审查 |
| 7 |
finishing-a-development-branch |
验证后合并/创建 PR/保留/丢弃分支 |
辅助技能
| 技能 |
功能说明 |
systematic-debugging |
4 阶段根因排查流程 |
verification-before-completion |
证据优于声明 --- 完成前验证所有内容 |
dispatching-parallel-agents |
并发分析任务 |
writing-skills |
创建你自己的技能 |
2.4 技能调用优先级
复制代码
用户消息
→ 是否有技能可能适用?(即使 1% 概率 = 是)
→ 是 → 调用 Skill 工具
→ 宣布 "Using [skill] to [purpose]"
→ 有检查清单?→ 创建 TodoWrite 项目
→ 严格遵循技能执行
→ 否 → 正常回复
指令优先级
- 用户明确指令(CLAUDE.md, 直接请求)--- 最高优先级
- Superpowers 技能 --- 在与默认行为冲突时覆盖
- 默认系统提示 --- 最低优先级
技能类型
- 刚性技能(TDD、调试):严格遵循,不得为适应上下文而偏离
- 灵活技能(模式类):将原则适配到上下文中
2.5 你应该警惕的信号(Red Flags)
以下想法表明你在回避使用技能:
| 想法 |
纠正 |
| "这只是个简单问题" |
问题就是任务,检查是否有技能 |
| "我需要先了解更多上下文" |
技能检查在澄清问题之前 |
| "让我先探索代码库" |
技能会告诉你如何探索,先检查 |
| "这不需要正式的技能" |
如果存在相关技能,就使用它 |
| "我记得这个技能" |
技能会进化,读取当前版本 |
2.6 跨平台适配
Superpowers 支持多种 AI 编程代理:
| 平台 |
技能调用方式 |
| Claude Code |
使用 Skill 工具 |
| Copilot CLI |
使用 skill 工具 |
| Gemini CLI |
使用 activate_skill 工具 |
| Codex |
技能原生加载 |
2.7 其他相关仓库
Part 3:gstack + Superpowers 协同使用
3.1 两者的关系
复制代码
Superpowers(方法论层)
↓ 定义 "如何" 工作
┌─────────────────────────────┐
│ TDD → SysDebug → Plan │
│ Code Review → Verify │
└─────────────────────────────┘
gstack(执行层)
↓ 定义 "谁" 来执行
┌─────────────────────────────┐
│ CEO → EngMgr → QA │
│ Designer → Security │
└─────────────────────────────┘
协同工作 = Superpowers 的流程规范 + gstack 的角色体系
- Superpowers 定义了方法论:如何做 TDD、如何调试、如何写计划、如何审查代码
- gstack 定义了角色:CEO 审查范围、工程经理锁定架构、QA 进行浏览器测试、安全官执行审计
两者互补,可以同时使用。
3.2 协同工作流示例
bash
复制代码
# 1. Superpowers: 先创建隔离工作空间
> /using-git-worktrees
# 2. Superpowers: 头脑风暴 + gstack: 产品规划
> /brainstorming # Superpowers 苏格拉底式设计细化
> /office-hours # gstack YC 式产品询问
# 3. gstack: 工程规划 + Superpowers: 写实施计划
> /plan-eng-review # gstack 架构审查
> /writing-plans # Superpowers 分解任务
# 4. 实现
> /executing-plans # Superpowers 逐个执行任务
> /test-driven-development # Superpowers RED-GREEN-REFACTOR
# 5. gstack: 审查 + Superpowers: 代码审查流程
> /review # gstack 预合并审查
> /requesting-code-review # Superpowers 对照计划审查
# 6. gstack: QA + Superpowers: 验证
> /qa staging.app.com # gstack 浏览器测试
> /verification-before-completion # Superpowers 证据收集
# 7. Superpowers: 完成分支
> /finishing-a-development-branch # 清理并合并
# 8. gstack: 交付
> /ship # gstack 创建 PR、测试、部署
3.3 使用建议
| 场景 |
推荐 |
| 新功能开发 |
Superpowers brainstorming + gstack /office-hours → gstack /plan-eng-review → Superpowers TDD 实现 → gstack /review + /qa → gstack /ship |
| Bug 修复 |
Superpowers systematic-debugging + gstack /investigate → Superpowers TDD 修复 → gstack /review |
| 代码审查 |
Superpowers receiving-code-review 接收 → gstack /review 审查 |
| 安全审计 |
gstack /cso(OWASP + STRIDE) |
| 设计工作 |
gstack /design-shotgun(多方案)→ /design-review(审计修复) |
| 学习固化 |
gstack /learn 保存项目经验 |
附录 A:官方仓库与文档
gstack 官方资源
Superpowers 官方资源
附录 B:网络教程与文章
gstack 教程与文章
Superpowers 教程与文章
相关工具与资源