华为云Ascend310服务器使用

使用华为云服务器

复制代码
cpu: 16vCPUs Kunpeng 920
内存:16GiB   
gpu:'4* HUAWEI Ascend 310
cann: 20.1.rc1
操作系统:Ubuntu aarch64

目的

使用该服务器进行docker镜像编译,测试模型。

已知生产环境:mindx版本为3.0.rc3,npu为310P,cpu为 Kunpeng 920

宿主机cann升级

cann下载地址:https://www.hiascend.com/developer/download/community/result?module=dl+pt+cann\&dl=3.0.0.alpha\&pt=6.0.1.alpha001\&cann=6.0.1.alpha001

npu驱动下载地址:

https://www.hiascend.com/hardware/firmware-drivers/community?product=2\&model=2\&cann=6.3.RC1.alpha001\&driver=1.0.18.alpha

复制代码
升级cann和驱动
chmod +x Ascend-cann-toolkit_6.0.1_linux-aarch64.run
./Ascend-cann-toolkit_6.0.1_linux-aarch64.run --install --install-for-all
reboot

chmod +x A300-3000-npu-driver_6.0.0_linux-aarch64.run
./A300-3000-npu-driver_6.0.0_linux-aarch64.run --full --install-for-all
reboot

查看是否升级成功
npu-smi info

华为云安装docker

docker插件下载地址:https://gitee.com/ascend/ascend-docker-runtime

复制代码
vi /etc/apt/sources.list
deb https://mirrors.huaweicloud.com/docker-ce/linux/ubuntu/ bionic stable
curl -fsSL https://repo.huaweicloud.com/docker-ce/linux/debian/gpg | sudo apt-key add -
apt-get update 
apt-get install -y docker-ce
systemctl start docker
docker version
chmod +x Ascend-docker-runtime_5.0.RC3.1_linux-aarch64.run
./Ascend-docker-runtime_5.0.RC3.1_linux-aarch64.run --install
systemctl restart docker
systemctl enable docker

寻找huawei docker基础镜像

ascendhub.huawei.com

比如 https://ascendhub.huawei.com/#/detail/infer-modelzoo

注意:拉取镜像权限密钥24小时过期,需重新申请。

后续

在基础镜像上,尝试程序编译,调试。

成功后,对应编辑Dockerfile文件,重新打镜像。

比如:

复制代码
FROM ascendhub.huawei.com/public-ascendhub/infer-modelzoo:22.0.0
EXPOSE 80
USER root
COPY ./ /home/cloud/
WORKDIR /home/cloud/
RUN apt update \
        && apt install python3.8 python3.8-dev python3.8-distutils python3.8-venv -y \
        && python3.8 /home/cloud/get-pip.py \
        && python3.8 -m pip install -r /home/cloud/requirements.txt -i https://mirror.baidu.com/pypi/simple
ENV LD_PRELOAD /usr/local/lib/python3.8/dist-packages/torch/lib/libgomp-d22c30c5.so.1
CMD ["/usr/bin/python3.8","/home/cloud/xxxx.py"]
相关推荐
YJlio5 小时前
PsService·下(7.21):Find/SetConfig 与服务的启动/停止/重启/暂停/恢复
linux·运维·服务器
草莓熊Lotso5 小时前
C++ 继承特殊场景解析:友元、静态成员与菱形继承的底层逻辑
服务器·开发语言·c++·人工智能·经验分享·笔记·1024程序员节
_OP_CHEN5 小时前
Linux系统编程:(六)深入理解 Linux 软件包管理器——从原理到 yum 实战全攻略
linux·运维·服务器·yum·软件包管理器·linux生态
路過的好心人5 小时前
Nginx 的多个场景配置
运维·网络·nginx
9ilk5 小时前
【基于one-loop-per-thread的高并发服务器】--- 前置技术
运维·服务器·c++·笔记·后端·中间件
qq_343247035 小时前
docker 下搭建 nacos
运维·docker·容器
人工智能训练5 小时前
Ubuntu系统中Docker的常用命令总结
linux·运维·人工智能·ubuntu·docker·ai
我命由我123456 小时前
IDEA - IDEA 快速回到页面首尾、页面快速滑动、快速定位到指定行
java·运维·ide·后端·java-ee·intellij-idea·intellij idea
AI小小怪10 小时前
在Linux服务器上安装CVAT (Docker 28.5.1)
运维·docker·容器·数据标注·cvat
KYGALYX14 小时前
在Linux中备份msyql数据库和表的详细操作
linux·运维·数据库