技术栈
从零复现deepseek r1
v_JULY_v
11 小时前
从零复现deepseek r1
·
deepseek v3源码解读
·
mla的实现
·
mtp的实现
·
grpo的实现
从零复现DeepSeek R1:从V3中对MoE、MLA、MTP的实现,到Open R1对R1中SFT、GRPO的实现
虽然我司从23年起,便逐步从教育为主转型到了科技为主,但不代表教育业务便没有了随着DeepSeek特别是R1、其次V3模型的大火,我司七月在线的大模型线上营群里一学员朋友DIFY问道:校长好,deepseek 的课程目前有多少内容啦,我想要参与学习,想请问一下关于v3和r1复现的课程有吗,不用那么大参数量,小尺寸就好