在昇腾310P推理服务器上安装CANN和PyTorch

之前一直没怎么用过昇腾这套架构,今天简单试一下。首先,在一个比较新的服务器上,运行:

bash 复制代码
npu-smi info

可以看到NPU型号是310P3。我想试试能否用Conda安装(在Nvidia平台上用得最多就是Conda环境了,和CUDA版本配合得很好),所以运行:

bash 复制代码
conda env list

发现这台服务器已经安装了Conda,那么想通过Conda试试(就像Conda+CUDA那样):

bash 复制代码
conda create -n SGLang python=3.10

(由于我主要想试试SGLang,所以对应起了这个环境的名字)

之后进入到这个虚拟环境,开始安装CANN(也不知道之前别人有没有装),参考这里:

https://www.hiascend.com/cann/download

这个页面分得比较细,包括昇腾的A3、A2、推理系列等等。如果不清楚NPU型号,可以按照页面上的提示再检查一下。然后按照页面上的步骤安装即可:

bash 复制代码
#conda所在目录需有755权限
conda config --add channels https://repo.huaweicloud.com/ascend/repos/conda/ 
conda install ascend::cann-toolkit==8.5.0
conda install ascend::cann-310p-ops==8.5.0

这个是比较简单的,简单讲讲怎么判断是否安装好:

上面这个网页写的是这样:

软件包的默认安装路径为所在Conda虚拟环境的Ascend目录下,例如base环境为/home/miniconda3/Ascend

复制代码
source /home/miniconda3/Ascend/cann/set_env.sh

python3 -c "import acl;print(acl.get_soc_name())"

若返回芯片型号,则安装成功

但是我用的这个操作系统比较奇葩,如果用conda env list,看到的安装目录是:

bash 复制代码
SGLang                *  /opt/miniconda/envs/SGLang

所以这就需要我们把上面的Source命令改一下:

bash 复制代码
source /opt/miniconda/envs/SGLang/Ascend/cann/set_env.sh

然后再运行:

bash 复制代码
python3 -c "import acl;print(acl.get_soc_name())"

可以看到这时候系统返回:

bash 复制代码
Ascend310P3

这就说明在这个conda环境下,CANN 8.5.0版本就安装好了。

先简单总结这么多,由于之前没用过,所以写得比较基础,后面准备再总结一下安装PyTorch和SGLang。也是因为发现SGLang给的网页例子里,一些新的大模型是没有310P对应的镜像的,例如这里的例子:

https://docs.sglang.io/platforms/ascend_npu_qwen3_5_examples.html

所以想试试手动是否能跑SGLang。

相关推荐
ZzT31 分钟前
怎么做才不会被 AI 替代?
人工智能·程序员
道友可好35 分钟前
从今天开始:你的第一个 Harness Engineering 实践
前端·人工智能·后端
呱呱复呱呱39 分钟前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
小姜前线技术2 小时前
AI回答代码块高亮加一键复制
人工智能
洛阳泰山2 小时前
从 0 到 1.6K Star:一个 Java 开源项目的增长复盘
人工智能·后端·开源
米小虾3 小时前
Agent Skill 设计模式完全指南
人工智能·agent
饼干哥哥3 小时前
保姆级教程:用Image2 + Seedance2.0 做长视频,以品牌广告为例
人工智能
米小虾4 小时前
Agent Skill 规范与 Skill-Creator 核心思想
人工智能·agent
ZhengEnCi4 小时前
09e-斯坦福CS336作业四:大规模语言模型训练数据收集与处理
人工智能
oil欧哟4 小时前
Codex 最佳实践(超级长文):先搞懂 AI,再用好 AI
前端·人工智能·后端