YC总裁Garry Tan开源“软件工厂”:2026年产量是2013年的240倍

一个人,不用自己写代码,AI干所有活

从产品构思到安全审计,23个专家角色,8个命令搞定

MIT协议,免费,开源


👨‍💼 先看一句话:Andrej Karpathy 说了一个惊人的事实

"我从去年12月以来基本上没自己写过一行代码了,这是一个极大的转变。" ------ Andrej Karpathy(OpenAI联合创始人),2026年3月

当Karpathy说这句话时,很多人好奇:一个人怎么做到像一支20人团队那样出货?

Peter Steinberger靠AI代理,几乎是单人开发了OpenClaw------24.7万GitHub Stars

Garry Tan(YC总裁)说:我也一样。

Garry Tan------Y Combinator总裁兼CEO,投资过Coinbase、Instacart、Rippling。在YC之前是Palantir早期员工,联合创立Posterous(卖给Twitter),并搭建了YC内部社交网络Bookface。

他用gstack(他自己的开源工具),在2026年(截至4月18日)已经完成了相当于2013年全年产量240倍的工作量------同时还在全职运营YC。

关键不是"谁敲了代码",而是"什么被交付了"。


🔥 gstack是什么?

gstack是一个开源"AI软件工厂"------把Claude Code变成一支虚拟工程团队。

一句话:你负责想,AI负责做。从产品构思到安全审计,全流程自动化

安装后,你获得:

  • 23个专家角色:CEO、工程经理、设计师、QA负责人、安全官、发布工程师......
  • 8个核心命令:从想法到上线,每个阶段一个命令
  • 全都在对话里完成:不用学新工具,跟Claude Code聊天就行
bash 复制代码
# 30秒安装
git clone 项目地址 ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup

然后你只需要说:

  • "我想做一个每日简报App" → /office-hours
  • "帮我把这个PR上线" → /ship

📦 核心工作流:从想法到上线,8个命令

每个命令对应一个"专家角色"。它们按顺序跑完一个完整的开发周期:

想 → 计划 → 构建 → 审查 → 测试 → 上线 → 复盘

命令 角色 做什么
/office-hours YC式产品导师 6个"拷问式"问题,帮你重新定义产品,而不是你想要的功能
/plan-ceo-review CEO/创始人 挑战你的范围,"这个功能真的需要吗?10倍好的产品是什么?"
/plan-eng-review 工程经理 锁定架构、数据流、状态机、测试矩阵、安全边界
/review 资深工程师 找出CI检测不到、但上线会炸的bug,自动修简单的
/qa QA负责人 打开真实浏览器,测试你的网站,找到bug,自动修,加回归测试
/ship 发布工程师 同步主分支、跑测试、推代码、开PR
/land-and-deploy 发布工程师 合并PR、等CI、部署、验证生产环境健康
/retro 工程经理 每周复盘:个人贡献、测试健康度、成长机会

一个实际流程

你跟Claude Code说:

"我想做一个日历每日简报App"

复制代码
你:   /office-hours
Claude: [追问6个问题------具体痛点是什么?不是"我想要个App",而是"你每天遇到什么麻烦"]

你:   "我有多个Google日历,活动信息经常过时,地点是错的......
       准备会议材料要花很久,结果还不够好......"

Claude: 我要反驳你的表述。你说的"每日简报App",
         其实你描述的是"个人AI参谋长"。
         [提取了5个你没意识到的能力]
         [挑战了4个前提假设]
         [给出了3种实现方案和工时估算]
         推荐:明天先交付最窄的版本,从真实使用中学习。

你:   /plan-ceo-review
       [读设计文档,挑战范围,跑10段审查]

你:   /review
       [自动修了2个问题] [问了你一个竞态条件]

你:   /qa https://staging.myapp.com
       [打开真实浏览器,点按钮、填表单、找到并修复了一个bug]

你:   /ship
       测试:42→51(新增9个)。PR已开。

你说的是"每日简报App",Claude说"你在建一个AI参谋长"------因为它听的是你的痛点,而不是你的功能请求。


🎯 为什么说它是"软件工厂"?

23个专家角色,各司其职

角色 负责什么
CEO 重新定义问题,砍掉不必要的功能
设计合伙人 从零建立设计系统、生成产品Mockup
设计工程师 把设计变成生产级HTML/CSS(不是"AI Demo"那种)
资深工程师 代码审查,找出CI漏掉的bug
QA负责人 真实浏览器测试,自动修bug
安全官 OWASP Top 10 + STRIDE威胁建模
发布工程师 合并、部署、验证
调试专家 系统级根因调试
...... 共23个

设计能力:从"描述"到"能上线的HTML"

/design-shotgun → 生成4-6个AI Mockup变体,浏览器里并排比较,你选喜欢的、给反馈,它迭代。记忆你的审美偏好。

/design-html → 把选中的设计变成真正的生产级HTML

  • 文字会随着容器宽度重排(不是固定宽度那种"AI画板")
  • 30KB开销,零依赖
  • 自动检测React/Svelte/Vue,输出对应格式

真实浏览器测试

/qa 不跑模拟,开真正的Chrome:

  • 点击、填表单、截图
  • 发现bug → 自动修 → 生成回归测试 → 重新验证

这是Garry Tan说的"巨大解锁"------让他从6个并行工人增加到12个。

安全审计

/cso → 跑OWASP Top 10 + STRIDE威胁模型:

  • 零噪音:17个误报排除规则
  • 8/10以上置信度才输出
  • 每个发现都有具体攻击场景

跨AI第二意见

/codex → 用OpenAI Codex CLI做独立代码审查。Claude和OpenAI都审过同一段代码时,显示交叉分析------哪些发现重叠、哪些是各自独有的。


🧠 为什么它能做到"一个人顶一支团队"?

1. 流程驱动,不是"问AI一个功能"

传统AI编程:你问问题,AI给答案。每个问题是孤立的。

gstack:每个命令的输出自动喂给下一个命令。/office-hours写设计文档,/plan-ceo-review读它;/review抓的bug,/ship验证是否已修。没有东西漏掉。

2. 并行工作流

一个任务跑的时候,另一个任务在另一个会话里同时跑。Garry Tan说他同时跑 10-15个并行Sprint

3. 记忆和学习

/learn → 技能跨会话保留项目特定的模式、坑、偏好。用越多,gstack越懂你的代码库。

4. 真实数据

2013年(建Bookface时):772次GitHub贡献。

2026年(截至4月18日):1,237次贡献。

同一个人,不同时代。差距是工具。

Garry Tan原文:"LOC批评者没说错------AI确实会膨胀原始代码行数。但他们错了的是:剔除通胀因素后,我的生产力不是降低了,而是大幅提高了。"

完整方法论见项目文档。


🎯 谁适合用?

人群 为什么适合
创始人/CTO(尤其技术型) 仍然想亲自发货,但不想亲自写每行代码
第一次用Claude Code的人 结构化角色,而不是空白提示框
技术负责人/资深工程师 每个PR都有严格审查、QA和发布自动化
单人团队/最小团队 一个人做出像有团队的效果
不想交AI"智商税"的人 免费、MIT协议、自托管

🔗 链接


✅ 总结

层次 核心内容
解决了什么 单人开发团队化------用AI代理做规划、设计、审查、测试、发布,全流程自动化
怎么用 30秒安装 → 跟Claude Code说话 → /office-hours/ship
核心能力 23个专家角色、8个核心命令、真实浏览器测试、设计到HTML、安全审计、跨AI第二意见
效果 2026年产量是2013年的240倍(Garry Tan实测)

gstack ------ 开源软件工厂,免费,MIT协议。

一个人,一支团队,一个命令。