技术栈
cs336
爱听歌的周童鞋
8 天前
llm
·
cs336
·
course summary
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Course Summary
完成这篇文章时已经是深夜了,想了想还是简单写一个课程总结吧,聊聊博主学完整个课程后的一些想法和感受。整个课程的学习是从去年 9 月份开始,一直持续到今年 3 月份才结束,一晃半年时间过去了,不过好在成功赶在 2026 年新课程开始之前结束了😄
爱听歌的周童鞋
10 天前
llm
·
policy gradient
·
assignment
·
grpo
·
cs336
·
experiments
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: GRPO
本篇文章记录 CS336 作业 Assignment 5: Alignment 中的 GRPO 作业要求,仅供自己参考😄
爱听歌的周童鞋
10 天前
llm
·
sft
·
math
·
assignment
·
cs336
·
expertiteration
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: SFT Implement
在上篇文章 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: SFT 中,我们已经了解了 SFT 的作业要求,下面我们就一起来看看这些作业该如何实现,本篇文章记录 CS336 作业 Assignment 5: Alignment 中的 SFT 实现,仅供自己参考😄
爱听歌的周童鞋
1 个月前
llm
·
triton
·
assignment
·
flashattention
·
cs336
·
jit-compiler
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: FlashAttention-2
本篇文章记录 CS336 作业 Assignment 2: Systems 中的 FlashAttention-2 作业要求,仅供自己参考😄
爱听歌的周童鞋
2 个月前
llm
·
assignment
·
cs336
·
bpe tokenizer
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: BPE Tokenizer
本篇文章记录 CS336 作业 Assignment 1: Basics 中的 BPE Tokenizer 作业要求,仅供自己参考😄
爱听歌的周童鞋
3 个月前
llm
·
policy gradient
·
grpo
·
cs336
·
baselines
·
advantage funcs
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2
学习斯坦福的 CS336 课程,本篇文章记录课程第十七讲:对齐 - RL(下),记录下个人学习笔记,仅供自己参考😄
爱听歌的周童鞋
4 个月前
llm
·
minicpm
·
deepseek
·
cs336
·
mup
·
scaling laws
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 11: Scaling laws 2
学习斯坦福的 CS336 课程,本篇文章记录课程第十一讲:推理,记录下个人学习笔记,仅供自己参考😄website:https://stanford-cs336.github.io/spring2025
爱听歌的周童鞋
5 个月前
llm
·
triton
·
profiling
·
cs336
·
kernels
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 6: Kernels,Triton
学习斯坦福的 CS336 课程,本篇文章记录课程第六讲:高性能 GPU 代码的编写,记录下个人学习笔记,仅供自己参考😄
爱听歌的周童鞋
5 个月前
llm
·
gpu
·
flashattention
·
cs336
·
tiling
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 5: GPUs
学习斯坦福的 CS336 课程,本篇文章记录课程第五讲:GPU,记录下个人学习笔记,仅供自己参考😄website:https://stanford-cs336.github.io/spring2025
爱听歌的周童鞋
5 个月前
llm
·
router
·
moe
·
cs336
·
deepseek-moe
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 4: Mixtrue of experts
学习斯坦福的 CS336 课程,本篇文章记录课程第四讲:混合专家模型,记录下个人学习笔记,仅供自己参考😄
我是有底线的