Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

2026 年 2 月,Karpathy 发布了 microgpt ------ 200 行纯 Python、零依赖的 GPT 实现。

包含全部核心算法:Tokenizer、Autograd、Transformer、Adam、训练+推理。

"This file is the complete algorithm. Everything else is just efficiency." --- Karpathy

为什么重要?

  1. 零依赖:只要标准库
  2. 完整实现:一气呵成
  3. 200 行:一周能吃透

核心模块

Tokenizer

python 复制代码
uchars = sorted(set(''.join(docs)))
BOS = len(uchars)

Autograd

python 复制代码
class Value:
    def __init__(self, data):
        self.data = data
        self.grad = 0.0

Transformer

python 复制代码
class Attention:
    def __call__(self, x):
        q = x @ self.wq
        att = q @ k.T / math.sqrt(self.head_size)
        return softmax(att) @ v

资源

相关推荐
lulu121654407842 分钟前
Claude Code Harness架构技术深度解析:生产级AI Agent工程化实践
java·人工智能·python·ai编程
7年前端辞职转AI3 小时前
Python 文件操作
python·编程语言
龙文浩_3 小时前
AI梯度下降与PyTorch张量操作技术指南
人工智能·pytorch·python·深度学习·神经网络·机器学习·自然语言处理
呱牛do it3 小时前
企业级绩效考核系统设计与实现:基于FastAPI + Vue3的全栈解决方案
python·fastapi
7年前端辞职转AI3 小时前
Python 容器数据类型
python·编程语言
云霄IT3 小时前
安卓开发之java转dex再转smali
android·java·python
果汁华3 小时前
Typer:基于类型提示的现代Python CLI框架
开发语言·网络·python
Claw开发者3 小时前
第1课:用20行Python造出你的第一个AI Agent
python
7年前端辞职转AI3 小时前
Python 流程控制语句
python·编程语言
7年前端辞职转AI3 小时前
Python 运算符
python·编程语言