Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析

2026 年 2 月,Karpathy 发布了 microgpt ------ 200 行纯 Python、零依赖的 GPT 实现。

包含全部核心算法:Tokenizer、Autograd、Transformer、Adam、训练+推理。

"This file is the complete algorithm. Everything else is just efficiency." --- Karpathy

为什么重要?

  1. 零依赖:只要标准库
  2. 完整实现:一气呵成
  3. 200 行:一周能吃透

核心模块

Tokenizer

python 复制代码
uchars = sorted(set(''.join(docs)))
BOS = len(uchars)

Autograd

python 复制代码
class Value:
    def __init__(self, data):
        self.data = data
        self.grad = 0.0

Transformer

python 复制代码
class Attention:
    def __call__(self, x):
        q = x @ self.wq
        att = q @ k.T / math.sqrt(self.head_size)
        return softmax(att) @ v

资源

相关推荐
FreakStudio几秒前
硬件版【Cursor】?aily blockly IDE尝鲜封神,实战硬伤尽显
python·单片机·嵌入式·大学生·面向对象·并行计算·电子diy·电子计算机
测试员周周2 小时前
【Appium 系列】第06节-页面对象实现 — LoginPage 实战
开发语言·前端·人工智能·python·功能测试·appium·测试用例
2301_783848652 小时前
优化文本分类中堆叠模型的网格搜索性能:避免训练卡顿的实战指南
jvm·数据库·python
CLX05053 小时前
如何安装Oracle 12c Cloud Control_OMS服务端组件与Agent部署
jvm·数据库·python
老纪4 小时前
SQL中如何查找特定的空值行:WHERE IS NULL深度解析
jvm·数据库·python
噜噜噜阿鲁~4 小时前
python学习笔记 | 10.0、面向对象编程
笔记·python·学习
weixin199701080164 小时前
[特殊字符] RESTful API 接口规范详解:构建高效、可扩展的 Web 服务(附 Python 源码)
前端·python·restful
2301_781571424 小时前
mysql数据库响应缓慢如何排查_使用EXPLAIN分析执行计划
jvm·数据库·python
彳亍1015 小时前
实现倒计时数字在到达1后自动隐藏(2为最后可见数字),同时继续运行至-1再终止
jvm·数据库·python
X56615 小时前
CSS如何处理SSR中CSS引入_在服务端渲染时提取关键CSS
jvm·数据库·python