Stanford CS336(2026)课程介绍

Stanford CS336(2026)把从零构建语言模型的全流程整合到一门课,提供完整的大模型开发实战训练。

不仅有Transformer从头实现、高性能优化(FlashAttention2、Triton内核),还覆盖数据清洗去重、Scaling Laws、RLHF对齐,甚至分布式训练系统。

官网:cs336.stanford.edu

YouTube:youtube.com/playlist?list=PLoROMvodv4rMqXOcazWaTUHhq-yembLCV

主要作业:

  • Assignment 1:实现Tokenizer、Transformer架构、优化器,从零训练语言模型;
  • Assignment 2:性能剖析+FlashAttention2 Triton实现,构建分布式训练系统;
  • Assignment 3:Scaling Laws分析,预测模型扩展性能;
  • Assignment 4:处理Common Crawl原始数据,数据过滤+去重;
  • Assignment 5:SFT+RL对齐,训练数学推理模型(可选DPO安全对齐)。

5单位实战课,支持GPU云服务(Modal $6.25/hr免费额度),Python/PyTorch熟练即可,适合AI研究者和工程师。

前置:CS229/CS224N线性代数概率论,超多代码量!

参考资料链接:

Stanford CS336 完整合集链接

  1. 课程主站
    https://cs336.stanford.edu/
    https://stanford-cs336.github.io/
  2. 课程 GitHub 仓库(课件、作业、代码)
    https://github.com/stanford-cs336
相关推荐
墨心@1 个月前
Byte-Pair Encoding (BPE) Tokenizer
人工智能·自然语言处理·nlp·datawhale·cs336·组队学习
爱听歌的周童鞋2 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Course Summary
llm·cs336·course summary
爱听歌的周童鞋2 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: GRPO
llm·policy gradient·assignment·grpo·cs336·experiments
爱听歌的周童鞋2 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: SFT Implement
llm·sft·math·assignment·cs336·expertiteration
爱听歌的周童鞋3 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: FlashAttention-2
llm·triton·assignment·flashattention·cs336·jit-compiler
爱听歌的周童鞋4 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: BPE Tokenizer
llm·assignment·cs336·bpe tokenizer
爱听歌的周童鞋4 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2
llm·policy gradient·grpo·cs336·baselines·advantage funcs
爱听歌的周童鞋6 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 11: Scaling laws 2
llm·minicpm·deepseek·cs336·mup·scaling laws
爱听歌的周童鞋7 个月前
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 6: Kernels,Triton
llm·triton·profiling·cs336·kernels