Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

2026 年 2 月,Karpathy 发布了 microgpt ------ 200 行纯 Python、零依赖的 GPT 实现。

包含全部核心算法:Tokenizer、Autograd、Transformer、Adam、训练+推理。

"This file is the complete algorithm. Everything else is just efficiency." --- Karpathy

为什么重要?

  1. 零依赖:只要标准库
  2. 完整实现:一气呵成
  3. 200 行:一周能吃透

核心模块

Tokenizer

python 复制代码
uchars = sorted(set(''.join(docs)))
BOS = len(uchars)

Autograd

python 复制代码
class Value:
    def __init__(self, data):
        self.data = data
        self.grad = 0.0

Transformer

python 复制代码
class Attention:
    def __call__(self, x):
        q = x @ self.wq
        att = q @ k.T / math.sqrt(self.head_size)
        return softmax(att) @ v

资源

相关推荐
zh路西法4 分钟前
【rosbridge-websocket】跨网络的ROS1与ROS2通讯法(上)
linux·网络·c++·python·websocket·网络协议
圆弧YH5 分钟前
python→ Language
python
装不满的克莱因瓶6 分钟前
掌握神经网络的模型结构
人工智能·python·深度学习·神经网络·机器学习·ai
稷下元歌8 分钟前
7天学会plc加机器视觉关于运动控制部份,配套视频在bib
开发语言·c++·git·vscode·python·docker·pip
奋斗的小方8 分钟前
Java进阶篇1-1:异常
java·开发语言·python
颜酱12 分钟前
LangChain 调大模型:模板拼接 + invoke / stream / batch
python·langchain
ice81303318113 分钟前
【Python】调用opencv识别图片人脸位置
人工智能·python·opencv
Full Stack Developme21 分钟前
Hutool CollUtil 教程
java·开发语言·windows·python
2601_9503689124 分钟前
镁钆稀土合金粉末,专业供应助力精密制造升级
python·制造
染指111026 分钟前
19.LangChain框架7-LangChain1.0版本使用Agent(中间件实例)
人工智能·python·机器学习·langchain·agent·rag