技术栈

deepseek-moe

爱听歌的周童鞋
8 小时前
llm·router·moe·cs336·deepseek-moe
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 4: Mixtrue of experts学习斯坦福的 CS336 课程,本篇文章记录课程第四讲:混合专家模型,记录下个人学习笔记,仅供自己参考😄
我是有底线的