Karpathy 加入 Anthropic 了，盘点他开源的 5 个硬核 GitHub 项目。

昨天 Karpathy 发了一条推，说自己正式加入 Anthropic 了。

OpenAI 联合创始人，特斯拉前 AI 总监，斯坦福 CS231n 主讲人，Eureka Labs 创始人。

兜兜转转，最后站到了 Anthropic 这边。

这次他去的是 Claude 预训练团队，跟着 Nick Joseph 干，还要新拉一支队伍专门研究怎么用 Claude 做 AI Coding。

消息一出，X 上直接炸了。

Karpathy 再 GitHub 上影响力也挺大的，开源了很多有影响力的开源项目。

这个人的风格很鲜明，用最少的代码，讲最深的道理。

没有花里胡哨的架构，没有一堆依赖，核心逻辑经常就几百行，但每一个都值得反复看。

挑出 5 个最有代表性的项目推荐一哈。

花 100 块训练你自己的 ChatGPT

Karpathy 说 100 美元就能从头训练一个自己的 ChatGPT 出来。

nanochat 就是干这个的。

它的定位很简单：The best ChatGPT that $100 can buy. 100 美元买到的最好 ChatGPT。

你租一台云 GPU 服务器，跑一个脚本，4 小时之后就能在类 ChatGPT 的 Web 界面里跟自己训练的模型聊天了。

从自定义 Rust tokenizer 到分布式训练再到 Web 推理服务，完整的一条链路全在一个仓库里搞定。

代码刻意保持 hackable，意思是你可以随便改着玩。不是那种配了一堆依赖你不敢动的框架，而是你打开看一遍就能理解整个流程的那种。

这个项目也是 karpathy 在他的 AI 教育公司 Eureka Labs 推出的课程 LLM101n 的毕业项目。

课程教你怎么从零构建 LLM，nanochat 是最终产物。

说白了，这个项目是给那些想搞懂 ChatGPT 完整链路的人准备的。比读论文有用 100 倍，因为你真的能跑起来。

最近听张小 jun 的播客，姚顺宇在面试 Anthropic 之前好像也研究了这个项目。

arduino 复制代码

开源地址：https://github.com/karpathy/nanochat

让 AI Agents 自动帮你做研究

这个项目是 karpathy 所有仓库里 Star 最多的。

是一个让 AI 自己跑实验的工具。

autoresearch 做的事情很简单但很炸裂：在单张 GPU 上，让 AI agents 自动基于 nanochat 进行训练实验和科学研究。

训练 LLM 的时候，人类研究员通常在调超参数、跑实验、看结果、分析日志、再调参数、再跑一轮。

autoresearch 把这个循环自动化了。

AI 自己调参，自己跑实验，自己分析结果，然后决定下一步做什么。

门槛很低，单张 GPU 就能跑。但它代表的思路很重要：AI 不只是被研究的对象，它也可以是做研究的人。

这是 karpathy 对 AI 辅助科研的探索方向。

目前这个领域还很早期，但想想看，如果 AI 能自己做研究，那进步速度就不是线性的了

arduino 复制代码

开源地址：https://github.com/karpathy/autoresearch

让多个大模型开会辩论给你答案

问一个问题，Claude 写一个答案，GPT 写一个答案，Gemini 也写一个。

然后让它们互相点评打分，最后由一个主席模型汇总出最终答案。

这就是 llm-council 的玩法。

它是一个本地 Web 应用，看起来像 ChatGPT，但背后的机制完全不同。

你输入问题，它通过 OpenRouter 把问题同时发给多个 LLM，每个模型独立作答，然后互相评审和排名，最终由 Chairman LLM 综合出最优回答。

karpathy 认为 LLM 集成的潜力被严重低估了。

想想也有道理。

单个模型有偏见、有盲区、有幻觉。但如果你让多个模型交叉验证，互相挑刺，最后综合出来的答案质量会高很多。

这个思路不光适用于问答。任何需要决策的场景，比如方案评审、代码审查、投资分析，都可以用多模型辩论的方式来做。

配置也很简单，通过 OpenRouter 随意组合模型，想加谁加谁。有人已经 fork 出来加了 Ollama 本地模型支持，还有人做了更现代的 UI。

arduino 复制代码

开源地址：https://github.com/karpathy/llm-council

给全美国 342 种职业打分

这个项目 Stars 不多，但可能是最值得普通人看的一个。

你的工作被 AI 影响的概率有多大？

karpathy 直接把全美国的职业都算了一遍。

他从美国劳工统计局爬取了 342 个职业的数据，覆盖了全美 1.43 亿个岗位。

然后让 LLM 对每个职业打一个 0-10 分的 AI 曝光度评分------分数越高，被 AI 被影响的风险越大。

最后做成了一个交互式 treemap 可视化。

点进去就能看到每个职业的详细信息：薪资中位数、从业人数、预期增长率，以及 AI 替代风险评分。

数据一目了然。

而且这个项目发布后还有个小插曲，一度被删除，后来又重新上线。

X 上讨论很热烈，很多人拿自己的职业去查，看看自己是不是该学点新技能了。

其实也有一个中国版的：madeye.github.io/jobs

arduino 复制代码

开源地址：https://github.com/karpathy/jobs

越用越聪明的个人知识库

这个是卡帕西在 2026 年 4 月发的一篇 Gist，但引发了巨大反响，5000 多 Stars，评论区全是各种开源实现。

我之前也写过文章，可以看看。

表达的意思是：大多数人用 AI 和文档交互的方式是 RAG，上传一堆文件，AI 检索相关片段，生成答案。

问题是每次提问，AI 都要从头检索和拼凑。

没有任何积累。 问一个需要综合五篇文档的复杂问题，AI 每次都要重新找到相关片段再拼起来。上次的成果全丢了。

卡帕西的思路是 让 LLM 增量构建和维护一个持久化的 Wiki。

你添加一个新来源（文章、论文、播客笔记），LLM 不只是索引它，而是读完之后把关键信息整合进已有的 Wiki 里。

更新实体页面、修改主题摘要、标注新旧数据的矛盾点、加强或挑战已有的综合结论。

知识编译一次，然后持续更新，而不是每次提问都从头来。

整个系统有三层：

Raw sources：你的原始文档，LLM 只读不写

The wiki：LLM 生成和维护的 Markdown 文件，实体页、概念页、比较分析、综述

The schema：配置文件（比如 CLAUDE.md），告诉 LLM 怎么组织 Wiki、怎么处理新来源

三个核心操作：Ingest（摄入新来源）、Query（提问）、Lint（定期健康检查，找矛盾、过时信息、孤立页面）。

卡帕西自己的用法是左边开着 Claude Code，右边开着 Obsidian。

Claude 修改 Wiki，他在 Obsidian 里实时浏览结果。用他的话说：Obsidian 是 IDE，LLM 是程序员，Wiki 是代码库。

这篇 Gist 发布后，社区涌现了大量开源实现：有人做了桌面应用、有人做了 VS Code 插件、有人加了知识图谱、有人做了完整的研究工作流。

评论区简直是一个 AI 知识管理工具的生态孵化器。

arduino 复制代码

开源地址：https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f