昇腾910b服务器上搭建yolo训练环境,使用Anaconda

安装anaconda 管理环境

uname -m 命令查看服务器架构 aarch/x86
https://repo.anaconda.com/archive/ 是anaconda下载官网,进入官网找到对应版本,右键复制链接,我下载的是Anaconda3-2024.02-1-Linux-x86_64.sh,回到服务器wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh下载anaconda
chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh
sudo ./Anaconda3-2024.02-1-Linux-x86_64.sh -b -p /opt/anaconda3进行安装,source /opt/anaconda3/bin/activate conda init,执行以下命令使其生效:source ~/.bashrc,检查是否安装成功:conda --version

设置清华源

复制代码
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

CANN 下载

1 先查看是否下载了cann,如果没下载过执行第二步

方法一:

复制代码
atc --version
输出示例:ATC version: 6.3.0

方法二:

查看 cann 安装目录中的版本文件

复制代码
ls /usr/local/Ascend/ascend-toolkit/
输出示例:
8.2
8.2.RC1

表示你安装了 CANN 6.3.0 或 7.0.0 等版本。

把 source.../set_env.sh 添加到 ~/.bashrc 中,让环境变量每次自动生效:

复制代码
find /usr/local/Ascend/ascend-toolkit/ -name "set_env.sh"

如果输出:

复制代码
/usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh

则将其添加到环境变量:

复制代码
echo "source /usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh" >> ~/.bashrc
source ~/.bashrc

2 确认没下载过cann,从头下载cann固件与驱动

https://gitee.com/ascend/pytorch 的readme里的【昇腾辅助软件】下查表,找自己想下载的pytorch版本所对应的CANN版本

CANN下载页面:https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=10&cann=7.0.0.alpha003&driver=1.0.21.alpha ,我pytorch想下载2.6.0版本,所以CANN下载8.2.rc1版本,组件选择NPU,软件包格式选择run,下载

增加可执行权限:chmod +x Ascend-cann-toolkit_7.0.0.alpha003_linux-aarch64.run

安装./Ascend-cann-toolkit_7.0.0.alpha001_linux-x86_64.run --install

安装过程中输入Y同意协议。安装完成后,若显示如下信息,则说明软件安装成功。
[INFO] Ascend-cann-toolkit install success

配置CANN环境变量,将下面这句话加入.bashrc:source /usr/local/Ascend/ascend-toolkit/set_env.sh

安装 pytorch

CANN对python版本有要求,同时需要安装一些python包,可以通过下面的脚本检查是否满足:

复制代码
cd /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/bin
bash prereq_check.bash

创建环境conda create -n etrain python=3.11 这里的python版本需要去https://gitee.com/ascend/pytorch下的readme里的【PyTorch与Python版本配套表】查看对应pytorch的版本,我pytorch想下载2.5.1的,所以python安装3.11版本的

进入环境:
conda activate etrain

安装依赖包

复制代码
pip install pyyaml
pip install numpy==1.26.4
pip install attrs cloudpickle decorator psutil scipy synr==0.5.0 tornado absl-py
pip install google-cloud google-cloud-vision protobuf==3.20.0

安装pytorch:

复制代码
pip install torch==2.6.0

安装 torch_npu 依赖

复制代码
pip install pyyaml
pip install setuptools

安装 torch_npu

复制代码
pip install torch-npu==2.6.0rc1

验证

复制代码
import torch
import torch_npu

x = torch.randn(2, 2).npu()
y = torch.randn(2, 2).npu()
z = x.mm(y)

print(z)
相关推荐
羑悻的小杀马特21 小时前
零成本搞定!异地访问 OpenClaw 最简方案:SSH 端口映射组网!
运维·服务器·人工智能·docker·自动化·ssh·openclaw
Leon_Chenl21 小时前
【已开源】【嵌入式 Linux 音视频+ AI 实战项目】瑞芯微 Rockchip 系列 RK3588-基于深度学习的人脸门禁+ IPC 智能安防监控系统
深度学习·opencv·yolo·ffmpeg·音视频·边缘计算·人脸识别+检测
magrich1 天前
安装NoMachine并解决无外接显示器桌面黑屏
linux·运维·服务器
fish_xk1 天前
Linus基础指令
linux·服务器
极智视界1 天前
分类数据集 - 棉花病虫害检测图像分类数据集下
人工智能·yolo·数据集·图像分类·算法训练·棉花病虫害检测
Mortalbreeze1 天前
软件包管理器yum和编辑器vim详解 —— 附带vim配置链接
linux·服务器
李日灐1 天前
< 7 > Linux 开发工具:git 版本控制器 和 cgdb/gdb 调试器
linux·运维·服务器·开发语言·git·调试器·gdb/cgdb
青木9601 天前
前后端开发调试运行技巧
linux·服务器·前端·后端·npm·uv
不懒不懒1 天前
【【零基础保姆级】YOLOv5 v2.0 环境搭建 + 口罩检测自定义数据集训练教程(Windows CPU 版)上】
yolo·yolov5
cui_ruicheng1 天前
Linux进程间通信(一):管道与IPC基础
linux·运维·服务器