昇腾910b服务器上搭建yolo训练环境,使用Anaconda

安装anaconda 管理环境

uname -m 命令查看服务器架构 aarch/x86
https://repo.anaconda.com/archive/ 是anaconda下载官网,进入官网找到对应版本,右键复制链接,我下载的是Anaconda3-2024.02-1-Linux-x86_64.sh,回到服务器wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh下载anaconda
chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh
sudo ./Anaconda3-2024.02-1-Linux-x86_64.sh -b -p /opt/anaconda3进行安装,source /opt/anaconda3/bin/activate conda init,执行以下命令使其生效:source ~/.bashrc,检查是否安装成功:conda --version

设置清华源

复制代码
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

CANN 下载

1 先查看是否下载了cann,如果没下载过执行第二步

方法一:

复制代码
atc --version
输出示例:ATC version: 6.3.0

方法二:

查看 cann 安装目录中的版本文件

复制代码
ls /usr/local/Ascend/ascend-toolkit/
输出示例:
8.2
8.2.RC1

表示你安装了 CANN 6.3.0 或 7.0.0 等版本。

把 source.../set_env.sh 添加到 ~/.bashrc 中,让环境变量每次自动生效:

复制代码
find /usr/local/Ascend/ascend-toolkit/ -name "set_env.sh"

如果输出:

复制代码
/usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh

则将其添加到环境变量:

复制代码
echo "source /usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh" >> ~/.bashrc
source ~/.bashrc

2 确认没下载过cann,从头下载cann固件与驱动

https://gitee.com/ascend/pytorch 的readme里的【昇腾辅助软件】下查表,找自己想下载的pytorch版本所对应的CANN版本

CANN下载页面:https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=10&cann=7.0.0.alpha003&driver=1.0.21.alpha ,我pytorch想下载2.6.0版本,所以CANN下载8.2.rc1版本,组件选择NPU,软件包格式选择run,下载

增加可执行权限:chmod +x Ascend-cann-toolkit_7.0.0.alpha003_linux-aarch64.run

安装./Ascend-cann-toolkit_7.0.0.alpha001_linux-x86_64.run --install

安装过程中输入Y同意协议。安装完成后,若显示如下信息,则说明软件安装成功。
[INFO] Ascend-cann-toolkit install success

配置CANN环境变量,将下面这句话加入.bashrc:source /usr/local/Ascend/ascend-toolkit/set_env.sh

安装 pytorch

CANN对python版本有要求,同时需要安装一些python包,可以通过下面的脚本检查是否满足:

复制代码
cd /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/bin
bash prereq_check.bash

创建环境conda create -n etrain python=3.11 这里的python版本需要去https://gitee.com/ascend/pytorch下的readme里的【PyTorch与Python版本配套表】查看对应pytorch的版本,我pytorch想下载2.5.1的,所以python安装3.11版本的

进入环境:
conda activate etrain

安装依赖包

复制代码
pip install pyyaml
pip install numpy==1.26.4
pip install attrs cloudpickle decorator psutil scipy synr==0.5.0 tornado absl-py
pip install google-cloud google-cloud-vision protobuf==3.20.0

安装pytorch:

复制代码
pip install torch==2.6.0

安装 torch_npu 依赖

复制代码
pip install pyyaml
pip install setuptools

安装 torch_npu

复制代码
pip install torch-npu==2.6.0rc1

验证

复制代码
import torch
import torch_npu

x = torch.randn(2, 2).npu()
y = torch.randn(2, 2).npu()
z = x.mm(y)

print(z)
相关推荐
小尧嵌入式19 小时前
Linux的shell命令
linux·运维·服务器·数据库·c++·windows·算法
OnlyEasyCode19 小时前
.net程序部署Linux运行
linux·运维·服务器
星哥说事19 小时前
Zabbix与Prometheus在服务器及网络设备管理中的应用
服务器·zabbix·prometheus
小嘟嘟267919 小时前
虚拟机网络问题故障定位
linux·服务器·网络
CQ_YM20 小时前
Linux进程终止
linux·服务器·前端·进程
胡萝卜3.020 小时前
现代C++特性深度探索:模板扩展、类增强、STL更新与Lambda表达式
服务器·开发语言·前端·c++·人工智能·lambda·移动构造和移动赋值
bruk_spp20 小时前
linux gpio获取
java·linux·服务器
郝学胜-神的一滴20 小时前
Linux C++会话编程:从基础到实践
linux·运维·服务器·开发语言·c++·程序人生·性能优化
骚团长20 小时前
SQL server 配置管理器-SQL server 服务-远程过程调试失败 [0x800706be]-(Express LocalDB卸载掉)完美解决!
java·服务器·express
Cat God 00720 小时前
CentOS 搭建 SFTP 服务器(三)
服务器·python·centos