PaddleOCR Android demo替换最新识别库和模型

PaddleOCR的官方Android demo使用的PaddleLite版本目前是2.10,使用的paddle_lite_opt优化后的模型是v2版本。目前最新的PaddleLite版本是2.13RC,最新的模型版本是v4,据说有比较大提升。那么如何在官方demo中体验最新版本的PaddleLite识别库和v4模型呢?

下载PaddleLite

可以直接下载官方编译好的:github.com/PaddlePaddl...

下载后,解压,放到Android demo的app module根目录下,文件夹重命名为PaddleLite(与demo原编译脚本运行后自动生成的文件夹同名)。目录结构为:

如果你想使用低于2.13的版本的PaddleLite,那么需要注意的是,只支持python == 2.7\3.5\3.6\3.7。github.com/PaddlePaddl...

安装paddlelite工具

pip install paddlelite==2.13rc0

需要注意的是,这一步需要安装跟上述PaddleLite同版本的命令行工具,来优化模型。如果使用其他版本的paddlelite工具优化出来的模型,使用时会报错"Error: This model is not supported, because kernel for 'io_copy' is not supported by Paddle-Lite."

由于我上述下载的PaddleLite推理库的版本是2.13RC,所以这里我就安装2.13rc0版本的paddlelite。

优化模型

从这里下载最新的模型:github.com/PaddlePaddl...

需要下载三个模型,分别是文本检测模型、文本识别模型、文本方向分类模型。都各自下载最新的版本。注意下载的是"推理模型",而不是"训练模型"或"nb模型"。

下载之后,使用上述通过pip安装的paddlelite工具进行优化:

paddle_lite_opt --model_file=./inference.pdmodel --param_file=./inference.pdiparams --optimize_out=./output --valid_targets=arm --optimize_out_type=naive_buffer

运行完成后,会得到一个nb文件。对上述下载的文本检测模型、文本识别模型、文本方向分类模型分别执行,得到三个nb文件。将这三个nb文件,放到Android demo的asserts文件夹中替换原始的三个模型文件。

修改CMakeLists.txt

查找文件中对${PaddleLite\_DIR}的使用,注释掉新版PaddleLite中不再存在的文件对应的add\_custom\_command,再修改libpaddle\_light\_api\_shared.so文件的路径。

收尾

修改Android demo中的MiniActivity.java/Predictor.java/string.xml中,对模型文件或者模型文件夹的定义,使其与新的模型文件相匹配

运行

完美运行

参考文献

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

相关推荐
Shawn_Shawn4 小时前
mcp学习笔记(一)-mcp核心概念梳理
人工智能·llm·mcp
33三 三like6 小时前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a6 小时前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
腾讯云开发者7 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗7 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
Coder_Boy_8 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
啊森要自信8 小时前
CANN ops-cv:面向计算机视觉的 AI 硬件端高效算子库核心架构与开发逻辑
人工智能·计算机视觉·架构·cann
2401_836235868 小时前
中安未来SDK15:以AI之眼,解锁企业档案的数字化基因
人工智能·科技·深度学习·ocr·生活
njsgcs8 小时前
llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体
人工智能·深度学习