创造"Vibe Coding"的人,亲手宣布它死了。但他不是在否定过去,是在定义未来。而我发现,我已经在做他说的那个"未来"了。
前情提要:这个人是谁
如果你在 AI 圈只认识三个人,Andrej Karpathy 应该是其中之一。
OpenAI 联合创始成员,Tesla AI 负责人,斯坦福 CS231n(深度学习圣经课)的授课人。现在创办 Eureka Labs 做 AI 教育。
2025 年,他随口发了一条推特,创造了一个词------Vibe Coding(凭感觉写代码,让 AI 代劳)。这个词火遍全球,92% 的开发者听说过它,直接催生了一个 94 亿美元的市场。
然后 2026 年 2 月,他自己说:这个词过时了。
创造者亲手杀死自己的作品------这才是最牛逼的地方。
第一步:700个实验,2天------Karpathy Loop(3月)
3 月 17 日,Fortune 报道了 Karpathy 的一个实验。
他让一个 AI Agent 连续跑了 2 天,自主执行了 700 个训练优化实验。不是人指导的 700 次------是 AI 自己读论文、生成假设、写代码、跑实验、从结果学习、再生成新假设。
结果:
- 发现 20 种优化策略
- 模型训练时间缩短 11%
- Shopify CEO 跟着做了一夜------性能提升 19%
方法极简,三个要素:
| 要素 | 内容 |
|---|---|
| 一个 Agent | 有权限修改一个文件 |
| 一个指标 | 单一、客观、可测试 |
| 一个时限 | 到时间停下来汇报 |
Karpathy 说:"所有 LLM 前沿实验室都会这样做。这是最终 Boss 战。"
我的实践:港股量化监控系统
看到这里我愣了一下------我已经在做类似的事了。
我的龙虾每个交易日自动跑 3 次信号分析:18 个维度、4 层流水线、有信号才通知。
stock-monitor/
├── SKILL.md ← AI Agent 的"任务书"
├── config/watchlist.json ← 监控什么、阈值多少
├── scripts/
│ ├── fetch_data.py ← 数据采集(双源兜底)
│ └── analyze_signals.py ← 18维度信号分析(14KB)
└── logs/
└── data-2026-04-11.json ← 真实运行日志
和 Karpathy Loop 的对比:
| Karpathy Loop | 我的监控系统 |
|---|---|
| 一个 Agent 修改一个文件 | 一个 Agent 跑一套分析流水线 |
| 单一指标(训练loss) | 18个指标(RSI/MACD/量价/舆情...) |
| 固定时限汇报 | 每日3次定时执行+有信号才推送 |
| 700次实验→20个优化 | 每日3次→积累信号日志→回测迭代 |
底层逻辑一模一样:设定目标 → AI 自主执行 → 到时间汇报 → 人决策。
4 月 12 日的真实输出:
🔴 腾讯控股 看空(5个信号)
⚠ RSI(14) = 22.3 → 超卖
⚠ 连续下跌 5 日
⚠ 波动率 = 30日均值 × 1.8
⚠ MACD 死叉
⚠ 量价背离: 价跌量增 3日
AI 操作建议:观望为主,等待企稳
不是模拟数据。是那天早上我 QQ 邮箱里收到的真实邮件。
第二步:杀死 Vibe Coding → Agentic Engineering(2月-4月)
这是整个故事的高潮。
Vibe Coding 怎么死的
Karpathy 2025 年说的是:"忘了代码的存在,完全沉浸在氛围中。"
一年后他发现了三个致命问题:
| 缺陷 | 数据 |
|---|---|
| 没有设计 | 跳过架构,第三版迭代时代码债反噬 |
| 没有测试 | AI 代码 bug 密度是人写的 1.7 倍 |
| 没有审查 | AI 代码安全漏洞是人写的 2.74 倍 |
2026 年 2 月 4 日,他发帖:"Vibe Coding is passé."
替代品:Agentic Engineering
| Vibe Coding | Agentic Engineering | |
|---|---|---|
| 你的角色 | 产品经理 | 架构师 |
| AI 的角色 | 全能外包 | 工程师团队 |
| 流程 | 想法→聊天→接受 | 定任务→AI执行→验收→通过才继续 |
一句话:不是不用 AI,是用 AI 的方式从"聊天"升级为"指挥"。
我的实践:迭代开发核心规则
我在用龙虾的时候,有一条铁律:
新功能必须走完整流程:PM Agent 分析需求 → Dev Agent 实现+写测试 → Test Agent 执行测试 → PM Agent 验收。绝不跳过流程直接写代码。
这不就是 Agentic Engineering 吗?只是我先做了,Karpathy 后命名了。
| Karpathy 的 Agentic Engineering | 我的迭代开发规则 |
|---|---|
| 定任务 | PM Agent 写 requirement_spec.json |
| AI 执行 | Dev Agent 实现 + 写测试 |
| 验收 | Test Agent 跑测试 → PM Agent 验收 |
| 通过才继续 | 不过不合并,打回重来 |
甚至我的内容创作流程也是这个模式------写一篇原稿(定任务)→ 龙虾生成 5 平台版本(AI 执行)→ 我审核(验收)→ 通过才发布。
articles/
├── s3-01-content-factory.md ← 原稿
├── s3-01-content-factory-wechat.html ← 公众号版
├── s3-01-juejin.md ← 掘金版
├── s3-01-cover.html ← 封面
├── s3-02-auto-monitor.md
├── s3-02-auto-monitor-wechat.html
├── ... (共 28 个文件,7篇 × 4版本)
一条指令,28 个文件。但每一个都经过我的验收。 这就是 Agentic Engineering------不是不管,是管得更高级。
第三步:LLM Knowledge Base------让 AI 维护你的大脑(4月)
4 月 3 日,Karpathy 分享了一个更深层的变化:
"我最近大部分的 Token 流量不再用来操作代码,而是用来操作知识。"
他的工作流:
原始资料(论文/文章/代码)
↓ LLM 编译
Markdown Wiki(结构化、分类、反向链接)
↓ Obsidian 查看
问答/研究查询
↓ 输出
Markdown / 幻灯片 / 图表 → 归档回 Wiki
↓ 健康检查
LLM 查找不一致、推断缺失、发现新连接
关键洞察:他几乎不手动编辑 Wiki------全部由 LLM 编写和维护。
40 万词的知识库,不需要 RAG,LLM 自动维护索引和摘要就够了。
我的实践:16 域知识图谱
我有一个 KNOWLEDGE-MAP.md------16 个知识域的路由表:
knowledge/
├── thinking-models/ --- 思考模型(10大模型)
├── itil-v4/ --- IT服务管理
├── pmbok/ --- 项目管理
├── investing/ --- 投资与财富管理
├── business-leaders/ --- 商业领袖方法论
├── product-design/ --- 产品设计
├── data-analytics/ --- 数据分析
├── behavioral-psychology/ --- 行为心理学
├── ai-engineering/ --- AI工程
├── ... (共 16 个域)
龙虾收到问题时,先查路由表定位知识域,再从对应文件提取内容,最后用匹配的思考模型组织回答。
和 Karpathy 对比:
| Karpathy | 我 |
|---|---|
| 用 LLM 编译 Wiki | 用 LLM 查询知识图谱 |
| Obsidian 查看 | Markdown 文件集 |
| LLM 自动维护 | 手动维护(差距在这里) |
| 40万词 | 16域(正在积累) |
差距在"自动维护"------Karpathy 让 LLM 做健康检查(查找不一致、推断缺失、发现新连接),我还是手动更新。这是下一步要升级的。
三步串起来,看到了什么?
把三件事放在一起看,Karpathy 的思路脉络非常清晰:
第一步:AI 自己做实验(Karpathy Loop)
→ AI 从"工具"变成"研究员"
第二步:人不写代码,但验收代码(Agentic Engineering)
→ 人从"执行者"变成"架构师"
第三步:AI 维护知识库(LLM Knowledge Base)
→ AI 从"回答问题"变成"积累知识"
一句话总结:AI 在升级为自主 Agent,人在升级为架构师和决策者。
这不是预测。这是正在发生的事。
所以我做了什么?
| Karpathy 的概念 | 我的实践 | 状态 |
|---|---|---|
| Karpathy Loop | 港股 18 维度监控系统,每日 3 次自动分析 | ✅ 已运行 |
| Agentic Engineering | 迭代开发规则:PM→Dev→Test→验收 | ✅ 已执行 |
| Agentic Engineering | 内容工厂:1 条指令 → 28 个文件 → 人验收 | ✅ 已产出 |
| LLM Knowledge Base | 16 域知识图谱 + 路由表 | ⚠️ 手动维护,待升级 |
我不是在"追随"Karpathy。我是在实践中走到了同一个方向,只是他先给出了名字。
这大概就是为什么看到他的动态时,我的第一反应不是"好厉害",而是"原来我做的这个事情叫这个名字"。
你能从中拿走什么?
1. 如果你还在"Vibe Coding"阶段
别慌。Vibe Coding 在探索期是对的。但一旦你的项目有了真实用户、或者 AI 写的代码你已经看不懂了------立刻切 Agentic Engineering。
切换标志:定任务 → AI 执行 → 你验收 → 通过才继续。
2. 如果你想搭自己的"Karpathy Loop"
三要素就够:一个 Agent + 一个可测指标 + 一个时间限制。
不一定是训练模型。监控股票、检查竞品价格、扫描舆情、审查代码质量------任何有明确指标的事都可以做成 Loop。
3. 如果你想让 AI 帮你积累知识
从一个目录开始。把你关注的领域的资料丢进去,让 AI 编译成 Markdown Wiki。每周让 AI 做一次"健康检查"------查不一致、补缺失、找连接。
不需要复杂工具。Markdown + AI Agent 就够了。
本篇工具链清单
| 工具 | 用途 |
|---|---|
| AI Agent(龙虾) | 股票监控 / 内容生产 / 知识管理 |
| Python + yfinance/westock | 数据采集(Karpathy Loop 实践) |
| SKILL.md | 任务定义(Agentic Engineering 实践) |
| KNOWLEDGE-MAP.md | 知识路由(LLM Knowledge Base 实践) |
| QQ 邮箱 SMTP | 信号推送 |
大佬的三步,不是三个独立事件。是一条线:AI 从工具变成 Agent,人从执行者变成决策者。 这条线上,每个人都在走。区别只是有些人先给了名字,有些人先做了实践。
路易乔布斯 © 2026
一深思 AI
