PaddleOCR Android demo替换最新识别库和模型

PaddleOCR的官方Android demo使用的PaddleLite版本目前是2.10,使用的paddle_lite_opt优化后的模型是v2版本。目前最新的PaddleLite版本是2.13RC,最新的模型版本是v4,据说有比较大提升。那么如何在官方demo中体验最新版本的PaddleLite识别库和v4模型呢?

下载PaddleLite

可以直接下载官方编译好的:github.com/PaddlePaddl...

下载后,解压,放到Android demo的app module根目录下,文件夹重命名为PaddleLite(与demo原编译脚本运行后自动生成的文件夹同名)。目录结构为:

如果你想使用低于2.13的版本的PaddleLite,那么需要注意的是,只支持python == 2.7\3.5\3.6\3.7。github.com/PaddlePaddl...

安装paddlelite工具

pip install paddlelite==2.13rc0

需要注意的是,这一步需要安装跟上述PaddleLite同版本的命令行工具,来优化模型。如果使用其他版本的paddlelite工具优化出来的模型,使用时会报错"Error: This model is not supported, because kernel for 'io_copy' is not supported by Paddle-Lite."

由于我上述下载的PaddleLite推理库的版本是2.13RC,所以这里我就安装2.13rc0版本的paddlelite。

优化模型

从这里下载最新的模型:github.com/PaddlePaddl...

需要下载三个模型,分别是文本检测模型、文本识别模型、文本方向分类模型。都各自下载最新的版本。注意下载的是"推理模型",而不是"训练模型"或"nb模型"。

下载之后,使用上述通过pip安装的paddlelite工具进行优化:

paddle_lite_opt --model_file=./inference.pdmodel --param_file=./inference.pdiparams --optimize_out=./output --valid_targets=arm --optimize_out_type=naive_buffer

运行完成后,会得到一个nb文件。对上述下载的文本检测模型、文本识别模型、文本方向分类模型分别执行,得到三个nb文件。将这三个nb文件,放到Android demo的asserts文件夹中替换原始的三个模型文件。

修改CMakeLists.txt

查找文件中对${PaddleLite\_DIR}的使用,注释掉新版PaddleLite中不再存在的文件对应的add\_custom\_command,再修改libpaddle\_light\_api\_shared.so文件的路径。

收尾

修改Android demo中的MiniActivity.java/Predictor.java/string.xml中,对模型文件或者模型文件夹的定义,使其与新的模型文件相匹配

运行

完美运行

参考文献

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

github.com/PaddlePaddl...

相关推荐
绝世这天下5 小时前
【在 DGX Spark 上运行 vLLM-Omni 用于 Qwen3-TTS(语音设计,语音克隆)】
人工智能
陈大鱼头6 小时前
[译]费尽心思来保障 OpenClaw ?那跟直接用 GPT 有什么区别?
人工智能
Fleshy数模6 小时前
玩转OpenCV:视频椒盐噪声处理与图像形态学操作实战
人工智能·opencv·音视频
幂律智能7 小时前
Agent × 流程引擎融合架构:从静态流程到智能流程编排
人工智能·架构·agent
无垠的广袤7 小时前
ChatECNU 大语言模型与 PicoClaw 部署
人工智能·语言模型·自然语言处理·嵌入式·树莓派
爱淋雨的男人7 小时前
自动驾驶感知相关算法
人工智能·算法·自动驾驶
互联网科技看点7 小时前
AI算力爆发叠加数据资产风口,铂拉锐科技布局去中心化数字生态
人工智能·科技·去中心化
如若1237 小时前
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
人工智能·pytorch·python
七牛云行业应用7 小时前
GPT-5.4能力前瞻:解析原生电脑操控(Computer Use)原理与Agent架构构建
人工智能·chatgpt·大语言模型·ai agent·mcp协议
带娃的IT创业者7 小时前
Prompt Engineering 进阶:让 AI 写出人类味道(完整指南)
人工智能·大模型·llm·prompt·写作技巧·ai 教学