昇思学习营-【模型开发与适配】学习心得_20250724

通过对《昇思+昇腾开发板：软硬结合玩转DeepSeek开发实战》视频课程的学习

了解了以下信息：

1.1 AIpro（20T 24G）香橙派

1.2 了解了香橙派tf卡系统的制卡流程

通过对课程的学习了解了许多小的大语言模型，如：

• DeepSeek-R1-Distill-Qwen-1.5B

• DeepSeek-Janus-Pro-1B

• Qwen1.5-0.5b

• TinyLlama-1.1B

• MiniCPM3-4B

本次咱们是在香橙派上跑DeepSeek-R1-Distill-Qwen-1.5B大语言模型

3.1 需要对香橙派设置一定的swap缓存

3.2 CANN版本要求社区版 8.0.0beta1

3.3 MindSpore版本要求2.5.0

3.4 MindSpore NLP 版本要求0.4分支

4.1 在加载模型时，直接加载fp16的权重

4.2 限制拉起的python进程数

4.3 手动限制进程最大内存占用，开了swap然后再限制内存就可以空出来给NPU用

5.1 加载LoRA adapter调优

5.2 在generate_kwargs中添加repetition_penalty=1.2调优

5.3 使用jit优化