Karpathy 加入 Anthropic 了,盘点他开源的 5 个硬核 GitHub 项目。

昨天 Karpathy 发了一条推,说自己正式加入 Anthropic 了。

OpenAI 联合创始人,特斯拉前 AI 总监,斯坦福 CS231n 主讲人,Eureka Labs 创始人。

兜兜转转,最后站到了 Anthropic 这边。

这次他去的是 Claude 预训练团队,跟着 Nick Joseph 干,还要新拉一支队伍专门研究怎么用 Claude 做 AI Coding。

消息一出,X 上直接炸了。

Karpathy 再 GitHub 上影响力也挺大的,开源了很多有影响力的开源项目。

这个人的风格很鲜明,用最少的代码,讲最深的道理。

没有花里胡哨的架构,没有一堆依赖,核心逻辑经常就几百行,但每一个都值得反复看。

挑出 5 个最有代表性的项目推荐一哈。

01

花 100 块训练你自己的 ChatGPT

Karpathy 说 100 美元就能从头训练一个自己的 ChatGPT 出来。

nanochat 就是干这个的。

它的定位很简单:The best ChatGPT that $100 can buy. 100 美元买到的最好 ChatGPT。

你租一台云 GPU 服务器,跑一个脚本,4 小时之后就能在类 ChatGPT 的 Web 界面里跟自己训练的模型聊天了。

从自定义 Rust tokenizer 到分布式训练再到 Web 推理服务,完整的一条链路全在一个仓库里搞定。

代码刻意保持 hackable,意思是你可以随便改着玩。不是那种配了一堆依赖你不敢动的框架,而是你打开看一遍就能理解整个流程的那种。

这个项目也是 karpathy 在他的 AI 教育公司 Eureka Labs 推出的课程 LLM101n 的毕业项目。

课程教你怎么从零构建 LLM,nanochat 是最终产物。

说白了,这个项目是给那些想搞懂 ChatGPT 完整链路的人准备的。比读论文有用 100 倍,因为你真的能跑起来。

最近听张小 jun 的播客,姚顺宇在面试 Anthropic 之前好像也研究了这个项目。

arduino 复制代码
开源地址:https://github.com/karpathy/nanochat

02

让 AI Agents 自动帮你做研究

这个项目是 karpathy 所有仓库里 Star 最多的。

是一个让 AI 自己跑实验的工具。

autoresearch 做的事情很简单但很炸裂:在单张 GPU 上,让 AI agents 自动基于 nanochat 进行训练实验和科学研究。

训练 LLM 的时候,人类研究员通常在调超参数、跑实验、看结果、分析日志、再调参数、再跑一轮。

autoresearch 把这个循环自动化了。

AI 自己调参,自己跑实验,自己分析结果,然后决定下一步做什么。

门槛很低,单张 GPU 就能跑。但它代表的思路很重要:AI 不只是被研究的对象,它也可以是做研究的人。

这是 karpathy 对 AI 辅助科研的探索方向。

目前这个领域还很早期,但想想看,如果 AI 能自己做研究,那进步速度就不是线性的了

arduino 复制代码
开源地址:https://github.com/karpathy/autoresearch

03

让多个大模型开会辩论给你答案

问一个问题,Claude 写一个答案,GPT 写一个答案,Gemini 也写一个。

然后让它们互相点评打分,最后由一个主席模型汇总出最终答案。

这就是 llm-council 的玩法。

它是一个本地 Web 应用,看起来像 ChatGPT,但背后的机制完全不同。

你输入问题,它通过 OpenRouter 把问题同时发给多个 LLM,每个模型独立作答,然后互相评审和排名,最终由 Chairman LLM 综合出最优回答。

karpathy 认为 LLM 集成的潜力被严重低估了。

想想也有道理。

单个模型有偏见、有盲区、有幻觉。但如果你让多个模型交叉验证,互相挑刺,最后综合出来的答案质量会高很多。

这个思路不光适用于问答。任何需要决策的场景,比如方案评审、代码审查、投资分析,都可以用多模型辩论的方式来做。

配置也很简单,通过 OpenRouter 随意组合模型,想加谁加谁。有人已经 fork 出来加了 Ollama 本地模型支持,还有人做了更现代的 UI。

arduino 复制代码
开源地址:https://github.com/karpathy/llm-council

04

给全美国 342 种职业打分

这个项目 Stars 不多,但可能是最值得普通人看的一个。

你的工作被 AI 影响的概率有多大?

karpathy 直接把全美国的职业都算了一遍。

他从美国劳工统计局爬取了 342 个职业的数据,覆盖了全美 1.43 亿个岗位。

然后让 LLM 对每个职业打一个 0-10 分的 AI 曝光度评分------分数越高,被 AI 被影响的风险越大。

最后做成了一个交互式 treemap 可视化。

点进去就能看到每个职业的详细信息:薪资中位数、从业人数、预期增长率,以及 AI 替代风险评分。

数据一目了然。

而且这个项目发布后还有个小插曲,一度被删除,后来又重新上线。

X 上讨论很热烈,很多人拿自己的职业去查,看看自己是不是该学点新技能了。

其实也有一个中国版的:madeye.github.io/jobs

arduino 复制代码
开源地址:https://github.com/karpathy/jobs

05

越用越聪明的个人知识库

这个是卡帕西在 2026 年 4 月发的一篇 Gist,但引发了巨大反响,5000 多 Stars,评论区全是各种开源实现。

我之前也写过文章,可以看看。

表达的意思是:大多数人用 AI 和文档交互的方式是 RAG,上传一堆文件,AI 检索相关片段,生成答案。

问题是每次提问,AI 都要从头检索和拼凑。

没有任何积累。 问一个需要综合五篇文档的复杂问题,AI 每次都要重新找到相关片段再拼起来。上次的成果全丢了。

卡帕西的思路是 让 LLM 增量构建和维护一个持久化的 Wiki。

你添加一个新来源(文章、论文、播客笔记),LLM 不只是索引它,而是读完之后把关键信息整合进已有的 Wiki 里。

更新实体页面、修改主题摘要、标注新旧数据的矛盾点、加强或挑战已有的综合结论。

知识编译一次,然后持续更新,而不是每次提问都从头来。

整个系统有三层:

Raw sources:你的原始文档,LLM 只读不写

The wiki:LLM 生成和维护的 Markdown 文件,实体页、概念页、比较分析、综述

The schema:配置文件(比如 CLAUDE.md),告诉 LLM 怎么组织 Wiki、怎么处理新来源

三个核心操作:Ingest(摄入新来源)、Query(提问)、Lint(定期健康检查,找矛盾、过时信息、孤立页面)。

卡帕西自己的用法是左边开着 Claude Code,右边开着 Obsidian。

Claude 修改 Wiki,他在 Obsidian 里实时浏览结果。用他的话说:Obsidian 是 IDE,LLM 是程序员,Wiki 是代码库。

这篇 Gist 发布后,社区涌现了大量开源实现:有人做了桌面应用、有人做了 VS Code 插件、有人加了知识图谱、有人做了完整的研究工作流。

评论区简直是一个 AI 知识管理工具的生态孵化器。

arduino 复制代码
开源地址:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
相关推荐
你的保护色5 小时前
RAID学习
github
ChampaignWolf5 小时前
GitHub Copilot 用于 SAP ABAP 在 VS Code 中:本地部署团队设置指南
github·copilot
VIV-5 小时前
Pycharm项目上传到Github
ide·pycharm·github
xG8XPvV5d5 小时前
GitHub Actions自动化部署全攻略
运维·自动化·github
ChampaignWolf8 小时前
GitHub 发布全新 Copilot 独立应用,正面硬刚 Claude Code 与 Codex
github·copilot
冴羽yayujs10 小时前
GitHub 热门项目-日榜(2026-05-19)
前端·javascript·github
梦梦代码精10 小时前
LikeShop开源多端商城系统:半年使用记录
git·uni-app·github
小猴小猴1 天前
GitHub本周热门项目(2026-05-18)
github
_大学牲1 天前
从零实现自己的agent第五期:子代理实现
github·agent·ai编程