Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

2026 年 2 月,Karpathy 发布了 microgpt ------ 200 行纯 Python、零依赖的 GPT 实现。

包含全部核心算法:Tokenizer、Autograd、Transformer、Adam、训练+推理。

"This file is the complete algorithm. Everything else is just efficiency." --- Karpathy

为什么重要?

  1. 零依赖:只要标准库
  2. 完整实现:一气呵成
  3. 200 行:一周能吃透

核心模块

Tokenizer

python 复制代码
uchars = sorted(set(''.join(docs)))
BOS = len(uchars)

Autograd

python 复制代码
class Value:
    def __init__(self, data):
        self.data = data
        self.grad = 0.0

Transformer

python 复制代码
class Attention:
    def __call__(self, x):
        q = x @ self.wq
        att = q @ k.T / math.sqrt(self.head_size)
        return softmax(att) @ v

资源

相关推荐
Warson_L22 分钟前
python的类&继承
python
Warson_L23 分钟前
类型标注/type annotation
python
ThreeS3 小时前
手搓MiniVLA全实战教程-一步一步用pytorch解释原理与思路
人工智能·python
金銀銅鐵4 小时前
[Python] 模 n 乘法的逆元计算器
python·数学·游戏
aqi005 小时前
15天学会AI应用开发(十)把文本嵌入模型换成国产模型
人工智能·python·ai编程
金銀銅鐵1 天前
[Python] 扩展欧几里得算法
python·数学·算法
Duckdblab1 天前
DuckDB 性能调优终极指南:打造闪电般的分析体验
python
带派擂总1 天前
Python全栈开发精华版最全合集(包含各种面试题) Day24_异常和错误
python
金銀銅鐵1 天前
n^5 和 n 的个位数是否总相等?
python·数学