PaddleOCR Android demo替换最新识别库和模型

PaddleOCR的官方Android demo使用的PaddleLite版本目前是2.10,使用的paddle_lite_opt优化后的模型是v2版本。目前最新的PaddleLite版本是2.13RC,最新的模型版本是v4,据说有比较大提升。那么如何在官方demo中体验最新版本的PaddleLite识别库和v4模型呢?

下载PaddleLite

可以直接下载官方编译好的:github.com/PaddlePaddl...

下载后,解压,放到Android demo的app module根目录下,文件夹重命名为PaddleLite(与demo原编译脚本运行后自动生成的文件夹同名)。目录结构为:

如果你想使用低于2.13的版本的PaddleLite,那么需要注意的是,只支持python == 2.7\3.5\3.6\3.7。github.com/PaddlePaddl...

安装paddlelite工具

pip install paddlelite==2.13rc0

需要注意的是,这一步需要安装跟上述PaddleLite同版本的命令行工具,来优化模型。如果使用其他版本的paddlelite工具优化出来的模型,使用时会报错"Error: This model is not supported, because kernel for 'io_copy' is not supported by Paddle-Lite."

由于我上述下载的PaddleLite推理库的版本是2.13RC,所以这里我就安装2.13rc0版本的paddlelite。

优化模型

从这里下载最新的模型:github.com/PaddlePaddl...

需要下载三个模型,分别是文本检测模型、文本识别模型、文本方向分类模型。都各自下载最新的版本。注意下载的是"推理模型",而不是"训练模型"或"nb模型"。

下载之后,使用上述通过pip安装的paddlelite工具进行优化:

paddle_lite_opt --model_file=./inference.pdmodel --param_file=./inference.pdiparams --optimize_out=./output --valid_targets=arm --optimize_out_type=naive_buffer

运行完成后,会得到一个nb文件。对上述下载的文本检测模型、文本识别模型、文本方向分类模型分别执行,得到三个nb文件。将这三个nb文件,放到Android demo的asserts文件夹中替换原始的三个模型文件。

修改CMakeLists.txt

查找文件中对${PaddleLite\_DIR}的使用,注释掉新版PaddleLite中不再存在的文件对应的add\_custom\_command,再修改libpaddle\_light\_api\_shared.so文件的路径。

收尾

修改Android demo中的MiniActivity.java/Predictor.java/string.xml中,对模型文件或者模型文件夹的定义,使其与新的模型文件相匹配

运行

完美运行

参考文献

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

相关推荐
东胜物联10 分钟前
探寻5G工业网关市场,5G工业网关品牌解析
人工智能·嵌入式硬件·5g
皓74120 分钟前
服饰电商行业知识管理的创新实践与知识中台的重要性
大数据·人工智能·科技·数据分析·零售
985小水博一枚呀1 小时前
【深度学习滑坡制图|论文解读3】基于融合CNN-Transformer网络和深度迁移学习的遥感影像滑坡制图方法
人工智能·深度学习·神经网络·cnn·transformer
AltmanChan1 小时前
大语言模型安全威胁
人工智能·安全·语言模型
985小水博一枚呀1 小时前
【深度学习滑坡制图|论文解读2】基于融合CNN-Transformer网络和深度迁移学习的遥感影像滑坡制图方法
人工智能·深度学习·神经网络·cnn·transformer·迁移学习
数据与后端架构提升之路1 小时前
从神经元到神经网络:深度学习的进化之旅
人工智能·神经网络·学习
爱技术的小伙子1 小时前
【ChatGPT】如何通过逐步提示提高ChatGPT的细节描写
人工智能·chatgpt
深度学习实战训练营3 小时前
基于CNN-RNN的影像报告生成
人工智能·深度学习
昨日之日20065 小时前
Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载
人工智能·whisper·语音识别
浮生如梦_5 小时前
Halcon基于laws纹理特征的SVM分类
图像处理·人工智能·算法·支持向量机·计算机视觉·分类·视觉检测