昇思学习营-Deepseek-r1-distill-qwen-1.5b模型开发与适配课程内容和学习心得

Deepseek-r1-distill-qwen-1.5b介绍

Deepseek-v3和r1的版本通过8张141张nvidia h200 gpu进行训练,训练和运行成本高,为节约成本,deepseek推出蒸馏板模型,基于r1版本的模型生成的高质量推理数据,在小模型上进行监督微调(sft,无强化学习或者偏好对齐训练阶段),具体过程如下:

  1. 选用 Llama 3.1/3.3 和 Qwen 2.5 的 6 个开源模型
  2. 用 R1 生成 80 万条高质量推理数据
  3. 基于这些数据进行监督微调(SFT,无 RL 阶段)

DeepSeek-R1-Distill-Qwen-1.5B在香橙派上的开发与适配

其中由于香橙派的板有8-12T和20T不同的算力版本,因此价格也是不同的,部署及开发人员根据自身的情况选择合适的板子进行开发。

详细的配置教学可以扫下面的二维码;

香橙派板子调试前的环境准备工作

版本查看:

香橙派板子的Mindspore版本查看:

通过mindspore官网的命令来升级

Mindnlp版本:

香橙派板子模型及网络调试(查看当前板子是否能够支持模型的运行)

模型调试命令如下:

MindSpore NLP套件中有针对模型的ut测试,可通过pytest来测试模型在香橙派的训练和推理,并进行问题定位和调试

设置环境变量:

export RUN_SLOW=True

执行命令:

Pytest -v -s tests/transformers/models/qwen2/test_modeling_qwen2.py

由于MindSpore动态图下框架存在多线程异步⾏为,所以会出现python调⽤栈不准确的场景,为了精准定位在test_modeling_qwen2.py脚本中import mindspore之后的位置,加入如下代码,重新跑pytest,查看具体的报错位置并根据报错信息修改

mindspore.set_context(pynative_synchronize=True)

对香橙派板子调试模型时报错的一些处理案例

针对算子缺失的处理方式及在实际工程文件中修改对应代码

针对损失函数报错的处理方式

针对香橙派上Tensor索引/切片报错的处理方式

学习心得:

  1. 对于香橙派上面训练和运行的deepseek蒸馏版本模型的方式有初步的了解。
  2. 对香橙派板子调试前的部署流程有初步认识。
  3. 对香橙派板子上面部署及测试mindspore有初步了解,及对部分异常及错误处理有明确认识。
相关推荐
做cv的小昊12 分钟前
计算机图形学:【Games101】学习笔记08——光线追踪(辐射度量学、渲染方程与全局光照、蒙特卡洛积分与路径追踪)
图像处理·笔记·学习·计算机视觉·游戏引擎·图形渲染·概率论
星恒随风13 分钟前
C++ 类和对象入门(五):初始化列表、explicit 和 static 成员详解
开发语言·c++·笔记·学习·状态模式
sensen_kiss2 小时前
CPT304 SoftwareEngineeringII 软件工程 2 Pt.8 软件测试 (Software Testing)(上)
学习·软件工程
力学与人工智能2 小时前
PPT分享 | 洛桑联邦理工学院魏震:深度几何学习在工业设计优化中的应用
学习·优化·工业设计·深度几何学习·洛桑联邦理工学院
sensen_kiss4 小时前
CPT304 SoftwareEngineeringII 软件工程 2 Pt.9 软件测试 (Software Testing)(下)
学习·软件工程
wu_ye_m4 小时前
学习c语言第35天 函数声明和定义
c语言·开发语言·学习
清辞8534 小时前
Coze从入门到实战---第一、二章
大数据·人工智能·学习·语言模型
伊布拉西莫5 小时前
【流畅的Python】第20章:并发执行器 — 学习笔记
笔记·python·学习
jinglong.zha5 小时前
LScript-从零基础到商业变现的AI自动化学习平台
运维·学习·自动化
闪闪发亮的小星星5 小时前
STK_00 学习方案路线
学习