【CANN训练营笔记】Atlas 200I DK A2体验手写数字识别模型训练&推理

环境介绍

开发板:Huawei Atals 200I DK A2

内存:4G

NPU:Ascend 310B4

CANN:7.0

准备环境

下载编译好的torch_npu

bash 复制代码
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/torch_npu-2.1.0rc1-cp39-cp39-linux_aarch64.whl
pip3 install torch_npu-2.1.0rc1-cp39-cp39-linux_aarch64.whl

安装PyTorch2.1.0、torchvision0.16.0

bash 复制代码
pip install torch==2.1.0 torchvision==0.16.0

设置环境变量

bash 复制代码
export DDK_PATH=/usr/local/Ascend/ascend-toolkit/latest
export NPU_HOST_LIB=$DDK_PATH/runtime/lib64/stub

安装ACLLite库

安装ffmpeg

Ubuntu

bash 复制代码
apt-get install ffmpeg libavcodec-dev libswscale-dev libavdevice-dev

欧拉系统

bash 复制代码
yum install ffmpeg ffmpeg-devel

将yum安装的opencv头文件软链到系统能默认识别的路径

bash 复制代码
ln -s /usr/include/ffmpeg/* /usr/include/

源码安装方式:

bash 复制代码
wget https://ffmpeg.org/releases/ffmpeg-4.2.9.tar.gz
tar -zxvf ffmpeg-4.2.9.tar.gz
cd ffmpeg-4.2.9
./configure --disable-static --enable-shared --disable-doc --enable-ffplay --enable-ffprobe --enable-avdevice --disable-debug --enable-demuxers --enable-parsers --enable-protocols --enable-small --enable-avresample
make -j8
make install

为保证程序能识别动态库,请在/etc/ld.so.conf.d下添加ffmpeg.conf配置

bash 复制代码
cd /etc/ld.so.conf.d
vim ffmpeg.conf

添加内容

复制代码
/usr/local/lib

生效配置文件:

bash 复制代码
ldconfig

设置ffmpeg安装路径环境变量,请替换为ffmpeg的实际安装路径

复制代码
export FFMPEG_PATH=/usr/local/lib

克隆ACLLite代码仓

bash 复制代码
git clone https://gitee.com/ascend/ACLLite.git
cd ACLLite

安装

bash 复制代码
bash build_so.sh

安装依赖

克隆代码仓

bash 复制代码
git clone https://gitee.com/ascend/EdgeAndRobotics/

进入代码文件夹

bash 复制代码
cd EdgeAndRobotics/Samples/HandWritingTrainAndInfer

安装依赖

bash 复制代码
pip3 install -r requirements.txt

模型训练

设置环境变量减小算子编译内存占用

bash 复制代码
export TE_PARALLEL_COMPILER=1
export MAX_COMPILE_CORE_NUMBER=1

运行训练脚本

bash 复制代码
python main.py

开始运行

NPU使用情况

在线推理

训练生成的mnist.pt转换mnist.onnx模型

bash 复制代码
python3 export.py

获取测试图片

bash 复制代码
cd data
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/mnist/8.jpg

测试图片:

执行在线推理

bash 复制代码
cd ../onnxInfer/
python3 infer.py

推理结果

复制代码
[image_path:data/8.jpg] [inferssession_time:1349 pictures/s] [output:8]

离线推理

获取测试图片

bash 复制代码
cd omInfer/data
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/mnist/8.jpg

获取PyTorch框架的ResNet50模型(.onnx),并转换为昇腾AI处理器能识别的模型( .om)

为了方便下载,在这里直接给出原始模型下载及模型转换命令,可以直接拷贝执行。

将在线推理时导出的mnist.onnx模型拷贝到model目录下

bash 复制代码
cd ../model
cp ../../mnist.onnx ./

获取AIPP配置文件

bash 复制代码
wget https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/wanzutao/mnist/ecs/aipp.cfg

模型转换

bash 复制代码
atc --model=mnist.onnx --framework=5 --insert_op_conf=aipp.cfg --output=mnist --soc_version=Ascend310B4

编译样例源码

bash 复制代码
cd ../scripts 
bash sample_build.sh

运行样例

bash 复制代码
bash sample_run.sh

运行结果

复制代码
[INFO] value[1.000000] output[8]
相关推荐
希露菲叶特格雷拉特19 分钟前
PyTorch深度学习笔记(二十)(模型验证测试)
人工智能·pytorch·笔记
lingggggaaaa2 小时前
小迪安全v2023学习笔记(一百四十五讲)—— Webshell篇&魔改冰蝎&打乱特征指纹&新增加密协议&过后门查杀&过流量识别
笔记·学习·安全·魔改冰蝎·免杀对抗·免杀技术
Digitally3 小时前
如何将iPhone上的笔记传输到电脑
笔记·电脑·iphone
lkbhua莱克瓦244 小时前
Java基础——常用算法4
java·数据结构·笔记·算法·github·排序算法·快速排序
学渣676564 小时前
11111
笔记
MeowKnight9584 小时前
【DIY】PCB练习记录2——51单片机核心板
笔记
tjsoft11 小时前
网站如何被百度收录之探索笔记
笔记
QT 小鲜肉13 小时前
【个人成长笔记】在 Linux 系统下撰写老化测试脚本以实现自动压测效果(亲测有效)
linux·开发语言·笔记·单片机·压力测试
MeowKnight95813 小时前
【Qt】Qt实践记录2——TCP通信服务器和客户端demo
笔记·qt
The_Second_Coming15 小时前
ELK 学习笔记
笔记·学习·elk