技术栈
deepseek-moe
爱听歌的周童鞋
8 小时前
llm
·
router
·
moe
·
cs336
·
deepseek-moe
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 4: Mixtrue of experts
学习斯坦福的 CS336 课程,本篇文章记录课程第四讲:混合专家模型,记录下个人学习笔记,仅供自己参考😄
我是有底线的