一、认识香橙派
通过对《昇思+昇腾开发板:软硬结合玩转DeepSeek开发实战》视频课程的学习
了解了以下信息:
1.1 AIpro(20T 24G)香橙派
1.2 了解了香橙派tf卡系统的制卡流程
二、认识大语言模型
通过对课程的学习了解了许多小的大语言模型,如:
• DeepSeek-R1-Distill-Qwen-1.5B
• DeepSeek-Janus-Pro-1B
• Qwen1.5-0.5b
• TinyLlama-1.1B
• MiniCPM3-4B
本次咱们是在香橙派上跑DeepSeek-R1-Distill-Qwen-1.5B大语言模型
三、了解本次课程的软件需求
3.1 需要对香橙派设置一定的swap缓存
3.2 CANN版本要求社区版 8.0.0beta1
3.3 MindSpore版本要求2.5.0
3.4 MindSpore NLP 版本要求0.4分支
四、了解了模型LoRA的微调流程
4.1 在加载模型时,直接加载fp16的权重
4.2 限制拉起的python进程数
4.3 手动限制进程最大内存占用,开了swap然后再限制内存就可以空出来给NPU用
五、了解了模型推理和性能优化的方案
5.1 加载LoRA adapter调优
5.2 在generate_kwargs中添加repetition_penalty=1.2调优
5.3 使用jit优化