昇腾910b服务器上搭建yolo训练环境,使用Anaconda

安装anaconda 管理环境

uname -m 命令查看服务器架构 aarch/x86
https://repo.anaconda.com/archive/ 是anaconda下载官网,进入官网找到对应版本,右键复制链接,我下载的是Anaconda3-2024.02-1-Linux-x86_64.sh,回到服务器wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh下载anaconda
chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh
sudo ./Anaconda3-2024.02-1-Linux-x86_64.sh -b -p /opt/anaconda3进行安装,source /opt/anaconda3/bin/activate conda init,执行以下命令使其生效:source ~/.bashrc,检查是否安装成功:conda --version

设置清华源

复制代码
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

CANN 下载

1 先查看是否下载了cann,如果没下载过执行第二步

方法一:

复制代码
atc --version
输出示例:ATC version: 6.3.0

方法二:

查看 cann 安装目录中的版本文件

复制代码
ls /usr/local/Ascend/ascend-toolkit/
输出示例:
8.2
8.2.RC1

表示你安装了 CANN 6.3.0 或 7.0.0 等版本。

把 source.../set_env.sh 添加到 ~/.bashrc 中,让环境变量每次自动生效:

复制代码
find /usr/local/Ascend/ascend-toolkit/ -name "set_env.sh"

如果输出:

复制代码
/usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh

则将其添加到环境变量:

复制代码
echo "source /usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh" >> ~/.bashrc
source ~/.bashrc

2 确认没下载过cann,从头下载cann固件与驱动

https://gitee.com/ascend/pytorch 的readme里的【昇腾辅助软件】下查表,找自己想下载的pytorch版本所对应的CANN版本

CANN下载页面:https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=10&cann=7.0.0.alpha003&driver=1.0.21.alpha ,我pytorch想下载2.6.0版本,所以CANN下载8.2.rc1版本,组件选择NPU,软件包格式选择run,下载

增加可执行权限:chmod +x Ascend-cann-toolkit_7.0.0.alpha003_linux-aarch64.run

安装./Ascend-cann-toolkit_7.0.0.alpha001_linux-x86_64.run --install

安装过程中输入Y同意协议。安装完成后,若显示如下信息,则说明软件安装成功。
[INFO] Ascend-cann-toolkit install success

配置CANN环境变量,将下面这句话加入.bashrc:source /usr/local/Ascend/ascend-toolkit/set_env.sh

安装 pytorch

CANN对python版本有要求,同时需要安装一些python包,可以通过下面的脚本检查是否满足:

复制代码
cd /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/bin
bash prereq_check.bash

创建环境conda create -n etrain python=3.11 这里的python版本需要去https://gitee.com/ascend/pytorch下的readme里的【PyTorch与Python版本配套表】查看对应pytorch的版本,我pytorch想下载2.5.1的,所以python安装3.11版本的

进入环境:
conda activate etrain

安装依赖包

复制代码
pip install pyyaml
pip install numpy==1.26.4
pip install attrs cloudpickle decorator psutil scipy synr==0.5.0 tornado absl-py
pip install google-cloud google-cloud-vision protobuf==3.20.0

安装pytorch:

复制代码
pip install torch==2.6.0

安装 torch_npu 依赖

复制代码
pip install pyyaml
pip install setuptools

安装 torch_npu

复制代码
pip install torch-npu==2.6.0rc1

验证

复制代码
import torch
import torch_npu

x = torch.randn(2, 2).npu()
y = torch.randn(2, 2).npu()
z = x.mm(y)

print(z)
相关推荐
珠海西格5 小时前
“主动预防” vs “事后补救”:分布式光伏防逆流技术的代际革命,西格电力给出标准答案
大数据·运维·服务器·分布式·云计算·能源
阿波罗尼亚5 小时前
Kubectl 命令记录
linux·运维·服务器
极智视界5 小时前
无人机场景 - 目标检测数据集 - 停车场停车位检测数据集下载
yolo·目标检测·数据集·无人机·voc·coco·算法训练
Fᴏʀ ʏ꯭ᴏ꯭ᴜ꯭.5 小时前
Keepalived单播模式配置与实战指南
linux·服务器·负载均衡
IDC02_FEIYA5 小时前
Linux文件搜索命令有哪些?Linux常用命令之文件搜索命令find详解
linux·运维·服务器
M158227690556 小时前
四通道全能组网!SG-Canet-410 CAN转以太网网关,破解工业CAN通信瓶颈
linux·运维·服务器
浪客灿心7 小时前
Linux库制作与原理
linux·运维·服务器
bantinghy7 小时前
Nginx基础加权轮询负载均衡算法
服务器·算法·nginx·负载均衡
wefg18 小时前
【Linux】文件管理
linux·运维·服务器
前网易架构师-高司机8 小时前
带标注信息的手机识别数据集,92.8%识别率,可识别户外公共场所的人是否带手机,支持yolo, coco json,pascal voc xml格式
yolo·手机·数据集·公共·户外·携带