Karpathy 用三步杀死了自己发明的概念——然后指出了AI的下一个形态

创造"Vibe Coding"的人，亲手宣布它死了。但他不是在否定过去，是在定义未来。而我发现，我已经在做他说的那个"未来"了。

前情提要：这个人是谁

如果你在 AI 圈只认识三个人，Andrej Karpathy 应该是其中之一。

OpenAI 联合创始成员，Tesla AI 负责人，斯坦福 CS231n（深度学习圣经课）的授课人。现在创办 Eureka Labs 做 AI 教育。

2025 年，他随口发了一条推特，创造了一个词------Vibe Coding（凭感觉写代码，让 AI 代劳）。这个词火遍全球，92% 的开发者听说过它，直接催生了一个 94 亿美元的市场。

然后 2026 年 2 月，他自己说：这个词过时了。

创造者亲手杀死自己的作品------这才是最牛逼的地方。

第一步：700个实验，2天------Karpathy Loop（3月）

3 月 17 日，Fortune 报道了 Karpathy 的一个实验。

他让一个 AI Agent 连续跑了 2 天，自主执行了 700 个训练优化实验。不是人指导的 700 次------是 AI 自己读论文、生成假设、写代码、跑实验、从结果学习、再生成新假设。

结果：

发现 20 种优化策略
模型训练时间缩短 11%
Shopify CEO 跟着做了一夜------性能提升 19%

方法极简，三个要素：

要素	内容
一个 Agent	有权限修改一个文件
一个指标	单一、客观、可测试
一个时限	到时间停下来汇报

Karpathy 说："所有 LLM 前沿实验室都会这样做。这是最终 Boss 战。"

我的实践：港股量化监控系统

看到这里我愣了一下------我已经在做类似的事了。

我的龙虾每个交易日自动跑 3 次信号分析：18 个维度、4 层流水线、有信号才通知。

复制代码

stock-monitor/
├── SKILL.md              ← AI Agent 的"任务书"
├── config/watchlist.json  ← 监控什么、阈值多少
├── scripts/
│   ├── fetch_data.py      ← 数据采集（双源兜底）
│   └── analyze_signals.py ← 18维度信号分析（14KB）
└── logs/
    └── data-2026-04-11.json ← 真实运行日志

和 Karpathy Loop 的对比：

Karpathy Loop	我的监控系统
一个 Agent 修改一个文件	一个 Agent 跑一套分析流水线
单一指标（训练loss）	18个指标（RSI/MACD/量价/舆情...）
固定时限汇报	每日3次定时执行+有信号才推送
700次实验→20个优化	每日3次→积累信号日志→回测迭代

底层逻辑一模一样：设定目标 → AI 自主执行 → 到时间汇报 → 人决策。

4 月 12 日的真实输出：

复制代码

🔴 腾讯控股 看空（5个信号）
  ⚠ RSI(14) = 22.3 → 超卖
  ⚠ 连续下跌 5 日
  ⚠ 波动率 = 30日均值 × 1.8
  ⚠ MACD 死叉
  ⚠ 量价背离: 价跌量增 3日

AI 操作建议：观望为主，等待企稳

不是模拟数据。是那天早上我 QQ 邮箱里收到的真实邮件。

第二步：杀死 Vibe Coding → Agentic Engineering（2月-4月）

这是整个故事的高潮。

Vibe Coding 怎么死的

Karpathy 2025 年说的是："忘了代码的存在，完全沉浸在氛围中。"

一年后他发现了三个致命问题：

缺陷	数据
没有设计	跳过架构，第三版迭代时代码债反噬
没有测试	AI 代码 bug 密度是人写的 1.7 倍
没有审查	AI 代码安全漏洞是人写的 2.74 倍

2026 年 2 月 4 日，他发帖："Vibe Coding is passé."

替代品：Agentic Engineering

	Vibe Coding	Agentic Engineering
你的角色	产品经理	架构师
AI 的角色	全能外包	工程师团队
流程	想法→聊天→接受	定任务→AI执行→验收→通过才继续

一句话：不是不用 AI，是用 AI 的方式从"聊天"升级为"指挥"。

我的实践：迭代开发核心规则

我在用龙虾的时候，有一条铁律：

新功能必须走完整流程：PM Agent 分析需求 → Dev Agent 实现+写测试 → Test Agent 执行测试 → PM Agent 验收。绝不跳过流程直接写代码。

这不就是 Agentic Engineering 吗？只是我先做了，Karpathy 后命名了。

Karpathy 的 Agentic Engineering	我的迭代开发规则
定任务	PM Agent 写 requirement_spec.json
AI 执行	Dev Agent 实现 + 写测试
验收	Test Agent 跑测试 → PM Agent 验收
通过才继续	不过不合并，打回重来

甚至我的内容创作流程也是这个模式------写一篇原稿（定任务）→ 龙虾生成 5 平台版本（AI 执行）→ 我审核（验收）→ 通过才发布。

复制代码

articles/
├── s3-01-content-factory.md          ← 原稿
├── s3-01-content-factory-wechat.html ← 公众号版
├── s3-01-juejin.md                   ← 掘金版
├── s3-01-cover.html                  ← 封面
├── s3-02-auto-monitor.md
├── s3-02-auto-monitor-wechat.html
├── ... (共 28 个文件，7篇 × 4版本)

一条指令，28 个文件。但每一个都经过我的验收。 这就是 Agentic Engineering------不是不管，是管得更高级。

第三步：LLM Knowledge Base------让 AI 维护你的大脑（4月）

4 月 3 日，Karpathy 分享了一个更深层的变化：

"我最近大部分的 Token 流量不再用来操作代码，而是用来操作知识。"

他的工作流：

复制代码

原始资料（论文/文章/代码）
    ↓ LLM 编译
Markdown Wiki（结构化、分类、反向链接）
    ↓ Obsidian 查看
问答/研究查询
    ↓ 输出
Markdown / 幻灯片 / 图表 → 归档回 Wiki
    ↓ 健康检查
LLM 查找不一致、推断缺失、发现新连接

关键洞察：他几乎不手动编辑 Wiki------全部由 LLM 编写和维护。

40 万词的知识库，不需要 RAG，LLM 自动维护索引和摘要就够了。

我的实践：16 域知识图谱

我有一个 KNOWLEDGE-MAP.md------16 个知识域的路由表：

复制代码

knowledge/
├── thinking-models/        --- 思考模型（10大模型）
├── itil-v4/                --- IT服务管理
├── pmbok/                  --- 项目管理
├── investing/              --- 投资与财富管理
├── business-leaders/       --- 商业领袖方法论
├── product-design/         --- 产品设计
├── data-analytics/         --- 数据分析
├── behavioral-psychology/  --- 行为心理学
├── ai-engineering/         --- AI工程
├── ... (共 16 个域)

龙虾收到问题时，先查路由表定位知识域，再从对应文件提取内容，最后用匹配的思考模型组织回答。

和 Karpathy 对比：

Karpathy	我
用 LLM 编译 Wiki	用 LLM 查询知识图谱
Obsidian 查看	Markdown 文件集
LLM 自动维护	手动维护（差距在这里）
40万词	16域（正在积累）

差距在"自动维护"------Karpathy 让 LLM 做健康检查（查找不一致、推断缺失、发现新连接），我还是手动更新。这是下一步要升级的。

三步串起来，看到了什么？

把三件事放在一起看，Karpathy 的思路脉络非常清晰：

复制代码

第一步：AI 自己做实验（Karpathy Loop）
    → AI 从"工具"变成"研究员"

第二步：人不写代码，但验收代码（Agentic Engineering）
    → 人从"执行者"变成"架构师"

第三步：AI 维护知识库（LLM Knowledge Base）
    → AI 从"回答问题"变成"积累知识"

一句话总结：AI 在升级为自主 Agent，人在升级为架构师和决策者。

这不是预测。这是正在发生的事。

所以我做了什么？

Karpathy 的概念	我的实践	状态
Karpathy Loop	港股 18 维度监控系统，每日 3 次自动分析	✅ 已运行
Agentic Engineering	迭代开发规则：PM→Dev→Test→验收	✅ 已执行
Agentic Engineering	内容工厂：1 条指令 → 28 个文件 → 人验收	✅ 已产出
LLM Knowledge Base	16 域知识图谱 + 路由表	⚠️ 手动维护，待升级

我不是在"追随"Karpathy。我是在实践中走到了同一个方向，只是他先给出了名字。

这大概就是为什么看到他的动态时，我的第一反应不是"好厉害"，而是"原来我做的这个事情叫这个名字"。

你能从中拿走什么？

1. 如果你还在"Vibe Coding"阶段

别慌。Vibe Coding 在探索期是对的。但一旦你的项目有了真实用户、或者 AI 写的代码你已经看不懂了------立刻切 Agentic Engineering。

切换标志：定任务 → AI 执行 → 你验收 → 通过才继续。

2. 如果你想搭自己的"Karpathy Loop"

三要素就够：一个 Agent + 一个可测指标 + 一个时间限制。

不一定是训练模型。监控股票、检查竞品价格、扫描舆情、审查代码质量------任何有明确指标的事都可以做成 Loop。

3. 如果你想让 AI 帮你积累知识

从一个目录开始。把你关注的领域的资料丢进去，让 AI 编译成 Markdown Wiki。每周让 AI 做一次"健康检查"------查不一致、补缺失、找连接。

不需要复杂工具。Markdown + AI Agent 就够了。

本篇工具链清单

工具	用途
AI Agent（龙虾）	股票监控 / 内容生产 / 知识管理
Python + yfinance/westock	数据采集（Karpathy Loop 实践）
SKILL.md	任务定义（Agentic Engineering 实践）
KNOWLEDGE-MAP.md	知识路由（LLM Knowledge Base 实践）
QQ 邮箱 SMTP	信号推送

大佬的三步，不是三个独立事件。是一条线：AI 从工具变成 Agent，人从执行者变成决策者。 这条线上，每个人都在走。区别只是有些人先给了名字，有些人先做了实践。