昇腾910b服务器上搭建yolo训练环境,使用Anaconda

安装anaconda 管理环境

uname -m 命令查看服务器架构 aarch/x86
https://repo.anaconda.com/archive/ 是anaconda下载官网,进入官网找到对应版本,右键复制链接,我下载的是Anaconda3-2024.02-1-Linux-x86_64.sh,回到服务器wget https://repo.anaconda.com/archive/Anaconda3-2024.02-1-Linux-x86_64.sh下载anaconda
chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh
sudo ./Anaconda3-2024.02-1-Linux-x86_64.sh -b -p /opt/anaconda3进行安装,source /opt/anaconda3/bin/activate conda init,执行以下命令使其生效:source ~/.bashrc,检查是否安装成功:conda --version

设置清华源

复制代码
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

CANN 下载

1 先查看是否下载了cann,如果没下载过执行第二步

方法一:

复制代码
atc --version
输出示例:ATC version: 6.3.0

方法二:

查看 cann 安装目录中的版本文件

复制代码
ls /usr/local/Ascend/ascend-toolkit/
输出示例:
8.2
8.2.RC1

表示你安装了 CANN 6.3.0 或 7.0.0 等版本。

把 source.../set_env.sh 添加到 ~/.bashrc 中,让环境变量每次自动生效:

复制代码
find /usr/local/Ascend/ascend-toolkit/ -name "set_env.sh"

如果输出:

复制代码
/usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh

则将其添加到环境变量:

复制代码
echo "source /usr/local/Ascend/ascend-toolkit/8.2.RC1.alpha003/aarch64-linux/script/set_env.sh" >> ~/.bashrc
source ~/.bashrc

2 确认没下载过cann,从头下载cann固件与驱动

https://gitee.com/ascend/pytorch 的readme里的【昇腾辅助软件】下查表,找自己想下载的pytorch版本所对应的CANN版本

CANN下载页面:https://www.hiascend.com/hardware/firmware-drivers/community?product=4&model=10&cann=7.0.0.alpha003&driver=1.0.21.alpha ,我pytorch想下载2.6.0版本,所以CANN下载8.2.rc1版本,组件选择NPU,软件包格式选择run,下载

增加可执行权限:chmod +x Ascend-cann-toolkit_7.0.0.alpha003_linux-aarch64.run

安装./Ascend-cann-toolkit_7.0.0.alpha001_linux-x86_64.run --install

安装过程中输入Y同意协议。安装完成后,若显示如下信息,则说明软件安装成功。
[INFO] Ascend-cann-toolkit install success

配置CANN环境变量,将下面这句话加入.bashrc:source /usr/local/Ascend/ascend-toolkit/set_env.sh

安装 pytorch

CANN对python版本有要求,同时需要安装一些python包,可以通过下面的脚本检查是否满足:

复制代码
cd /usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/bin
bash prereq_check.bash

创建环境conda create -n etrain python=3.11 这里的python版本需要去https://gitee.com/ascend/pytorch下的readme里的【PyTorch与Python版本配套表】查看对应pytorch的版本,我pytorch想下载2.5.1的,所以python安装3.11版本的

进入环境:
conda activate etrain

安装依赖包

复制代码
pip install pyyaml
pip install numpy==1.26.4
pip install attrs cloudpickle decorator psutil scipy synr==0.5.0 tornado absl-py
pip install google-cloud google-cloud-vision protobuf==3.20.0

安装pytorch:

复制代码
pip install torch==2.6.0

安装 torch_npu 依赖

复制代码
pip install pyyaml
pip install setuptools

安装 torch_npu

复制代码
pip install torch-npu==2.6.0rc1

验证

复制代码
import torch
import torch_npu

x = torch.randn(2, 2).npu()
y = torch.randn(2, 2).npu()
z = x.mm(y)

print(z)
相关推荐
AI棒棒牛24 分钟前
论文精读系列:Retinanet——目标检测领域中的SCI对比实验算法介绍!可一键跑通的对比实验,极大节省小伙伴的时间!!!
yolo·目标检测·计算机视觉·对比实验·1024程序员节·创新·rtdter
落羽的落羽1 小时前
【Linux系统】从零掌握make与Makefile:高效自动化构建项目的工具
linux·服务器·开发语言·c++·人工智能·机器学习·1024程序员节
TG:@yunlaoda360 云老大1 小时前
腾讯云国际站WAF:如何在腾讯云WAF上设置CC攻击防护,以保障业务数据免被恶意爬取?
服务器·云计算·腾讯云
遇雪长安2 小时前
深度学习YOLO实战:4、模型的三要素:任务、类别与规模
人工智能·深度学习·yolo
Mr.H01272 小时前
gitbash链接远程仓库时,出现的ssh密钥链接问题
运维·服务器·ssh·bash
wanhengidc2 小时前
云手机是一种应用软件吗?
运维·服务器·网络·游戏·智能手机·1024程序员节
wanhengidc3 小时前
云手机 无限畅玩手游 巨 椰
运维·服务器·网络·游戏·智能手机
hhhh明3 小时前
Google Drive 超大文件下载到服务器
服务器·网络·google drive
j_xxx404_4 小时前
Linux:权限(完结)|权限管理|修改权限chmod chown charp|文件类型|拓展
linux·运维·服务器
板鸭〈小号〉4 小时前
应用层自定义协议与序列化
运维·服务器·网络·1024程序员节