
一个人,不用自己写代码,AI干所有活
从产品构思到安全审计,23个专家角色,8个命令搞定
MIT协议,免费,开源
👨💼 先看一句话:Andrej Karpathy 说了一个惊人的事实
"我从去年12月以来基本上没自己写过一行代码了,这是一个极大的转变。" ------ Andrej Karpathy(OpenAI联合创始人),2026年3月
当Karpathy说这句话时,很多人好奇:一个人怎么做到像一支20人团队那样出货?
Peter Steinberger靠AI代理,几乎是单人开发了OpenClaw------24.7万GitHub Stars。
Garry Tan(YC总裁)说:我也一样。
Garry Tan------Y Combinator总裁兼CEO,投资过Coinbase、Instacart、Rippling。在YC之前是Palantir早期员工,联合创立Posterous(卖给Twitter),并搭建了YC内部社交网络Bookface。
他用gstack(他自己的开源工具),在2026年(截至4月18日)已经完成了相当于2013年全年产量240倍的工作量------同时还在全职运营YC。
关键不是"谁敲了代码",而是"什么被交付了"。
🔥 gstack是什么?
gstack是一个开源"AI软件工厂"------把Claude Code变成一支虚拟工程团队。
一句话:你负责想,AI负责做。从产品构思到安全审计,全流程自动化
安装后,你获得:
- 23个专家角色:CEO、工程经理、设计师、QA负责人、安全官、发布工程师......
- 8个核心命令:从想法到上线,每个阶段一个命令
- 全都在对话里完成:不用学新工具,跟Claude Code聊天就行
bash
# 30秒安装
git clone 项目地址 ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
然后你只需要说:
- "我想做一个每日简报App" →
/office-hours - "帮我把这个PR上线" →
/ship
📦 核心工作流:从想法到上线,8个命令
每个命令对应一个"专家角色"。它们按顺序跑完一个完整的开发周期:
想 → 计划 → 构建 → 审查 → 测试 → 上线 → 复盘
| 命令 | 角色 | 做什么 |
|---|---|---|
/office-hours |
YC式产品导师 | 6个"拷问式"问题,帮你重新定义产品,而不是你想要的功能 |
/plan-ceo-review |
CEO/创始人 | 挑战你的范围,"这个功能真的需要吗?10倍好的产品是什么?" |
/plan-eng-review |
工程经理 | 锁定架构、数据流、状态机、测试矩阵、安全边界 |
/review |
资深工程师 | 找出CI检测不到、但上线会炸的bug,自动修简单的 |
/qa |
QA负责人 | 打开真实浏览器,测试你的网站,找到bug,自动修,加回归测试 |
/ship |
发布工程师 | 同步主分支、跑测试、推代码、开PR |
/land-and-deploy |
发布工程师 | 合并PR、等CI、部署、验证生产环境健康 |
/retro |
工程经理 | 每周复盘:个人贡献、测试健康度、成长机会 |
一个实际流程
你跟Claude Code说:
"我想做一个日历每日简报App"
你: /office-hours
Claude: [追问6个问题------具体痛点是什么?不是"我想要个App",而是"你每天遇到什么麻烦"]
你: "我有多个Google日历,活动信息经常过时,地点是错的......
准备会议材料要花很久,结果还不够好......"
Claude: 我要反驳你的表述。你说的"每日简报App",
其实你描述的是"个人AI参谋长"。
[提取了5个你没意识到的能力]
[挑战了4个前提假设]
[给出了3种实现方案和工时估算]
推荐:明天先交付最窄的版本,从真实使用中学习。
你: /plan-ceo-review
[读设计文档,挑战范围,跑10段审查]
你: /review
[自动修了2个问题] [问了你一个竞态条件]
你: /qa https://staging.myapp.com
[打开真实浏览器,点按钮、填表单、找到并修复了一个bug]
你: /ship
测试:42→51(新增9个)。PR已开。
你说的是"每日简报App",Claude说"你在建一个AI参谋长"------因为它听的是你的痛点,而不是你的功能请求。
🎯 为什么说它是"软件工厂"?
23个专家角色,各司其职
| 角色 | 负责什么 |
|---|---|
| CEO | 重新定义问题,砍掉不必要的功能 |
| 设计合伙人 | 从零建立设计系统、生成产品Mockup |
| 设计工程师 | 把设计变成生产级HTML/CSS(不是"AI Demo"那种) |
| 资深工程师 | 代码审查,找出CI漏掉的bug |
| QA负责人 | 真实浏览器测试,自动修bug |
| 安全官 | OWASP Top 10 + STRIDE威胁建模 |
| 发布工程师 | 合并、部署、验证 |
| 调试专家 | 系统级根因调试 |
| ...... | 共23个 |
设计能力:从"描述"到"能上线的HTML"
/design-shotgun → 生成4-6个AI Mockup变体,浏览器里并排比较,你选喜欢的、给反馈,它迭代。记忆你的审美偏好。
/design-html → 把选中的设计变成真正的生产级HTML:
- 文字会随着容器宽度重排(不是固定宽度那种"AI画板")
- 30KB开销,零依赖
- 自动检测React/Svelte/Vue,输出对应格式
真实浏览器测试
/qa 不跑模拟,开真正的Chrome:
- 点击、填表单、截图
- 发现bug → 自动修 → 生成回归测试 → 重新验证
这是Garry Tan说的"巨大解锁"------让他从6个并行工人增加到12个。
安全审计
/cso → 跑OWASP Top 10 + STRIDE威胁模型:
- 零噪音:17个误报排除规则
- 8/10以上置信度才输出
- 每个发现都有具体攻击场景
跨AI第二意见
/codex → 用OpenAI Codex CLI做独立代码审查。Claude和OpenAI都审过同一段代码时,显示交叉分析------哪些发现重叠、哪些是各自独有的。
🧠 为什么它能做到"一个人顶一支团队"?
1. 流程驱动,不是"问AI一个功能"
传统AI编程:你问问题,AI给答案。每个问题是孤立的。
gstack:每个命令的输出自动喂给下一个命令。/office-hours写设计文档,/plan-ceo-review读它;/review抓的bug,/ship验证是否已修。没有东西漏掉。
2. 并行工作流
一个任务跑的时候,另一个任务在另一个会话里同时跑。Garry Tan说他同时跑 10-15个并行Sprint。
3. 记忆和学习
/learn → 技能跨会话保留项目特定的模式、坑、偏好。用越多,gstack越懂你的代码库。
4. 真实数据
2013年(建Bookface时):772次GitHub贡献。
2026年(截至4月18日):1,237次贡献。
同一个人,不同时代。差距是工具。
Garry Tan原文:"LOC批评者没说错------AI确实会膨胀原始代码行数。但他们错了的是:剔除通胀因素后,我的生产力不是降低了,而是大幅提高了。"
完整方法论见项目文档。
🎯 谁适合用?
| 人群 | 为什么适合 |
|---|---|
| 创始人/CTO(尤其技术型) | 仍然想亲自发货,但不想亲自写每行代码 |
| 第一次用Claude Code的人 | 结构化角色,而不是空白提示框 |
| 技术负责人/资深工程师 | 每个PR都有严格审查、QA和发布自动化 |
| 单人团队/最小团队 | 一个人做出像有团队的效果 |
| 不想交AI"智商税"的人 | 免费、MIT协议、自托管 |
🔗 链接
- GitHub:github.com/garrytan/gstack
- 许可证:MIT
- 作者:Garry Tan(YC总裁)
✅ 总结
| 层次 | 核心内容 |
|---|---|
| 解决了什么 | 单人开发团队化------用AI代理做规划、设计、审查、测试、发布,全流程自动化 |
| 怎么用 | 30秒安装 → 跟Claude Code说话 → /office-hours → /ship |
| 核心能力 | 23个专家角色、8个核心命令、真实浏览器测试、设计到HTML、安全审计、跨AI第二意见 |
| 效果 | 2026年产量是2013年的240倍(Garry Tan实测) |
gstack ------ 开源软件工厂,免费,MIT协议。
一个人,一支团队,一个命令。