cs336

爱听歌的周童鞋8 天前
llm·cs336·course summary
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Course Summary完成这篇文章时已经是深夜了,想了想还是简单写一个课程总结吧,聊聊博主学完整个课程后的一些想法和感受。整个课程的学习是从去年 9 月份开始,一直持续到今年 3 月份才结束,一晃半年时间过去了,不过好在成功赶在 2026 年新课程开始之前结束了😄
爱听歌的周童鞋10 天前
llm·policy gradient·assignment·grpo·cs336·experiments
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: GRPO本篇文章记录 CS336 作业 Assignment 5: Alignment 中的 GRPO 作业要求,仅供自己参考😄
爱听歌的周童鞋10 天前
llm·sft·math·assignment·cs336·expertiteration
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: SFT Implement在上篇文章 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 5: SFT 中,我们已经了解了 SFT 的作业要求,下面我们就一起来看看这些作业该如何实现,本篇文章记录 CS336 作业 Assignment 5: Alignment 中的 SFT 实现,仅供自己参考😄
爱听歌的周童鞋1 个月前
llm·triton·assignment·flashattention·cs336·jit-compiler
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: FlashAttention-2本篇文章记录 CS336 作业 Assignment 2: Systems 中的 FlashAttention-2 作业要求,仅供自己参考😄
爱听歌的周童鞋2 个月前
llm·assignment·cs336·bpe tokenizer
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: BPE Tokenizer本篇文章记录 CS336 作业 Assignment 1: Basics 中的 BPE Tokenizer 作业要求,仅供自己参考😄
爱听歌的周童鞋3 个月前
llm·policy gradient·grpo·cs336·baselines·advantage funcs
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2学习斯坦福的 CS336 课程,本篇文章记录课程第十七讲:对齐 - RL(下),记录下个人学习笔记,仅供自己参考😄
爱听歌的周童鞋4 个月前
llm·minicpm·deepseek·cs336·mup·scaling laws
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 11: Scaling laws 2学习斯坦福的 CS336 课程,本篇文章记录课程第十一讲:推理,记录下个人学习笔记,仅供自己参考😄website:https://stanford-cs336.github.io/spring2025
爱听歌的周童鞋5 个月前
llm·triton·profiling·cs336·kernels
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 6: Kernels,Triton学习斯坦福的 CS336 课程,本篇文章记录课程第六讲:高性能 GPU 代码的编写,记录下个人学习笔记,仅供自己参考😄
爱听歌的周童鞋5 个月前
llm·gpu·flashattention·cs336·tiling
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 5: GPUs学习斯坦福的 CS336 课程,本篇文章记录课程第五讲:GPU,记录下个人学习笔记,仅供自己参考😄website:https://stanford-cs336.github.io/spring2025
爱听歌的周童鞋5 个月前
llm·router·moe·cs336·deepseek-moe
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 4: Mixtrue of experts学习斯坦福的 CS336 课程,本篇文章记录课程第四讲:混合专家模型,记录下个人学习笔记,仅供自己参考😄
我是有底线的