【CANN训练营笔记】Atlas 200I DK A2体验手写数字识别模型训练&推理

环境介绍

开发板:Huawei Atals 200I DK A2

内存:4G

NPU:Ascend 310B4

CANN:7.0

准备环境

下载编译好的torch_npu

bash 复制代码
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/torch_npu-2.1.0rc1-cp39-cp39-linux_aarch64.whl
pip3 install torch_npu-2.1.0rc1-cp39-cp39-linux_aarch64.whl

安装PyTorch2.1.0、torchvision0.16.0

bash 复制代码
pip install torch==2.1.0 torchvision==0.16.0

设置环境变量

bash 复制代码
export DDK_PATH=/usr/local/Ascend/ascend-toolkit/latest
export NPU_HOST_LIB=$DDK_PATH/runtime/lib64/stub

安装ACLLite库

安装ffmpeg

Ubuntu

bash 复制代码
apt-get install ffmpeg libavcodec-dev libswscale-dev libavdevice-dev

欧拉系统

bash 复制代码
yum install ffmpeg ffmpeg-devel

将yum安装的opencv头文件软链到系统能默认识别的路径

bash 复制代码
ln -s /usr/include/ffmpeg/* /usr/include/

源码安装方式:

bash 复制代码
wget https://ffmpeg.org/releases/ffmpeg-4.2.9.tar.gz
tar -zxvf ffmpeg-4.2.9.tar.gz
cd ffmpeg-4.2.9
./configure --disable-static --enable-shared --disable-doc --enable-ffplay --enable-ffprobe --enable-avdevice --disable-debug --enable-demuxers --enable-parsers --enable-protocols --enable-small --enable-avresample
make -j8
make install

为保证程序能识别动态库,请在/etc/ld.so.conf.d下添加ffmpeg.conf配置

bash 复制代码
cd /etc/ld.so.conf.d
vim ffmpeg.conf

添加内容

复制代码
/usr/local/lib

生效配置文件:

bash 复制代码
ldconfig

设置ffmpeg安装路径环境变量,请替换为ffmpeg的实际安装路径

复制代码
export FFMPEG_PATH=/usr/local/lib

克隆ACLLite代码仓

bash 复制代码
git clone https://gitee.com/ascend/ACLLite.git
cd ACLLite

安装

bash 复制代码
bash build_so.sh

安装依赖

克隆代码仓

bash 复制代码
git clone https://gitee.com/ascend/EdgeAndRobotics/

进入代码文件夹

bash 复制代码
cd EdgeAndRobotics/Samples/HandWritingTrainAndInfer

安装依赖

bash 复制代码
pip3 install -r requirements.txt

模型训练

设置环境变量减小算子编译内存占用

bash 复制代码
export TE_PARALLEL_COMPILER=1
export MAX_COMPILE_CORE_NUMBER=1

运行训练脚本

bash 复制代码
python main.py

开始运行

NPU使用情况

在线推理

训练生成的mnist.pt转换mnist.onnx模型

bash 复制代码
python3 export.py

获取测试图片

bash 复制代码
cd data
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/mnist/8.jpg

测试图片:

执行在线推理

bash 复制代码
cd ../onnxInfer/
python3 infer.py

推理结果

复制代码
[image_path:data/8.jpg] [inferssession_time:1349 pictures/s] [output:8]

离线推理

获取测试图片

bash 复制代码
cd omInfer/data
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/mnist/8.jpg

获取PyTorch框架的ResNet50模型(.onnx),并转换为昇腾AI处理器能识别的模型( .om)

为了方便下载,在这里直接给出原始模型下载及模型转换命令,可以直接拷贝执行。

将在线推理时导出的mnist.onnx模型拷贝到model目录下

bash 复制代码
cd ../model
cp ../../mnist.onnx ./

获取AIPP配置文件

bash 复制代码
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/mnist/ecs/aipp.cfg

模型转换

bash 复制代码
atc --model=mnist.onnx --framework=5 --insert_op_conf=aipp.cfg --output=mnist --soc_version=Ascend310B4

编译样例源码

bash 复制代码
cd ../scripts 
bash sample_build.sh

运行样例

bash 复制代码
bash sample_run.sh

运行结果

复制代码
[INFO] value[1.000000] output[8]
相关推荐
摇滚侠27 分钟前
Java 零基础全套视频教程,面向对象(高级),笔记 105-120
java·开发语言·笔记
tq10861 小时前
程序行为的效应构成:约束、规则与延迟固化的统一视角
笔记
Alice-YUE1 小时前
前端图片优化完全指南:从格式到加载的全面提速方案
前端·笔记·学习
Stella Blog1 小时前
狂神Java基础学习笔记Day05
java·笔记·学习
枷锁—sha1 小时前
【CTFshow-pwn系列】03_栈溢出【pwn 073】详解:静态编译下的自动化 ROP 链构建
网络·汇编·笔记·安全·网络安全·自动化
你数过天上的星星吗2 小时前
Python学习笔记二(函数、类与对象)
笔记·python·学习
Titan20242 小时前
C++11学习笔记
c++·笔记·学习
寒秋花开曾相惜2 小时前
(学习笔记)4.2 逻辑设计和硬件控制语言HCL(4.2.3 字级的组合电路和HCL整数表达式)
android·网络·数据结构·笔记·学习
Titan20243 小时前
C++位图学习笔记
c++·笔记·学习
乘风遨游天地间3 小时前
CSTQB笔记-基础级CTFL(更新中)
笔记