昇腾910b服务器上搭建yolo训练环境,使用Anaconda

安装anaconda 管理环境

uname -m 命令查看服务器架构 aarch/x86
https://repo.anaconda.com/archive/ 是anaconda下载官网,进入官网找到对应版本,右键复制链接,我下载的是Anaconda3-2024.02-1-Linux-x86_64.sh,回到服务器wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh下载anaconda
chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh
sudo ./Anaconda3-2024.02-1-Linux-x86_64.sh -b -p /opt/anaconda3进行安装,source /opt/anaconda3/bin/activate conda init,执行以下命令使其生效:source ~/.bashrc,检查是否安装成功:conda --version

设置清华源

复制代码
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

CANN 下载

1 先查看是否下载了cann,如果没下载过执行第二步

方法一:

复制代码
atc --version
输出示例:ATC version: 6.3.0

方法二:

查看 cann 安装目录中的版本文件

复制代码
ls /usr/local/Ascend/ascend-toolkit/
输出示例:
8.2
8.2.RC1

表示你安装了 CANN 6.3.0 或 7.0.0 等版本。

把 source.../set_env.sh 添加到 ~/.bashrc 中,让环境变量每次自动生效:

复制代码
find /usr/local/Ascend/ascend-toolkit/ -name "set_env.sh"

如果输出:

复制代码
/usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh

则将其添加到环境变量:

复制代码
echo "source /usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh" >> ~/.bashrc
source ~/.bashrc

2 确认没下载过cann,从头下载cann固件与驱动

https://gitee.com/ascend/pytorch 的readme里的【昇腾辅助软件】下查表,找自己想下载的pytorch版本所对应的CANN版本

CANN下载页面:https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=10&cann=7.0.0.alpha003&driver=1.0.21.alpha ,我pytorch想下载2.6.0版本,所以CANN下载8.2.rc1版本,组件选择NPU,软件包格式选择run,下载

增加可执行权限:chmod +x Ascend-cann-toolkit_7.0.0.alpha003_linux-aarch64.run

安装./Ascend-cann-toolkit_7.0.0.alpha001_linux-x86_64.run --install

安装过程中输入Y同意协议。安装完成后,若显示如下信息,则说明软件安装成功。
[INFO] Ascend-cann-toolkit install success

配置CANN环境变量,将下面这句话加入.bashrc:source /usr/local/Ascend/ascend-toolkit/set_env.sh

安装 pytorch

CANN对python版本有要求,同时需要安装一些python包,可以通过下面的脚本检查是否满足:

复制代码
cd /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/bin
bash prereq_check.bash

创建环境conda create -n etrain python=3.11 这里的python版本需要去https://gitee.com/ascend/pytorch下的readme里的【PyTorch与Python版本配套表】查看对应pytorch的版本,我pytorch想下载2.5.1的,所以python安装3.11版本的

进入环境:
conda activate etrain

安装依赖包

复制代码
pip install pyyaml
pip install numpy==1.26.4
pip install attrs cloudpickle decorator psutil scipy synr==0.5.0 tornado absl-py
pip install google-cloud google-cloud-vision protobuf==3.20.0

安装pytorch:

复制代码
pip install torch==2.6.0

安装 torch_npu 依赖

复制代码
pip install pyyaml
pip install setuptools

安装 torch_npu

复制代码
pip install torch-npu==2.6.0rc1

验证

复制代码
import torch
import torch_npu

x = torch.randn(2, 2).npu()
y = torch.randn(2, 2).npu()
z = x.mm(y)

print(z)
相关推荐
做运维的阿瑞几秒前
Linux环境变量持久化完全指南
linux·运维·服务器
天才奇男子34 分钟前
从零开始搭建Linux Web服务器
linux·服务器·前端
Wang's Blog1 小时前
MySQL: 服务器性能优化全面指南:参数配置与数据库设计的最佳实践
服务器·数据库·mysql
顾安r1 小时前
11.14 脚本网页 迷宫逃离
服务器·javascript·游戏·flask·html
Sunhen_Qiletian2 小时前
YOLOv2算法详解(上篇):从经典到进化的目标检测之路
算法·yolo·目标检测
QTreeY1232 小时前
detr目标检测+deepsort/strongsort/bytetrack/botsort算法的多目标跟踪实现
人工智能·算法·yolo·目标检测·计算机视觉·目标跟踪
创思通信2 小时前
基于K210的人脸识别开锁
人工智能·yolo·人脸识别·k210
Orlando cron2 小时前
CPU Load(系统平均负载)
运维·服务器·网络
SUPER52662 小时前
deepseek-R1模型输出时截断异常
运维·服务器·deepseek-r1调用
qq_321665334 小时前
验证centos 服务器(或其他linux服务器),443或80端口是否开通
linux·服务器·centos