RapidOCR - 兼容性广泛的多平台多语言OCR工具

小众AI2024-12-11 21:48

更多AI开源软件：

RapidOCR是一款兼容性最为广泛的多平台多语言OCR工具，它完全开源免费，并支持离线环境下的快速部署。其核心亮点在于采用ONNXRuntime作为推理引擎，相比传统的PaddlePaddle推理引擎，速度实现了4至5倍的提升，同时彻底解决了内存泄露问题，确保了高效稳定的运行。

3200 Stars 378 Forks 10 Issues 23 贡献者 Apache-2.0 License Python 语言

代码: GitHub - RapidAI/RapidOCR: 📄 Awesome OCR multiple programing languages toolkits based on ONNXRuntime, OpenVINO and PaddlePaddle.

主页: RapidOCR 文档

主要功能

跨平台支持：RapidOCR支持多种操作系统，包括但不限于Windows、Linux、MacOS、Android、iOS等，这使得用户可以在不同的设备和平台上使用RapidOCR进行光学字符识别。

多语言识别：RapidOCR具备强大的多语言识别能力，默认支持中文和英文的识别，并且可以通过自定义转换实现对其他语言的支持。据相关介绍，RapidOCR可以识别超过60种语言的文本，这为用户处理多语种混合的文档提供了极大的便利。

高性能推理：RapidOCR采用ONNXRuntime作为推理引擎，相比传统的PaddlePaddle推理引擎，速度提升了4至5倍，并且彻底解决了内存泄露问题，确保了高效稳定的运行。这使得RapidOCR在处理大规模文本识别任务时表现出色。

安装和使用

安装

复制代码

pip install rapidocr_onnxruntime

使用

复制代码

from rapidocr_onnxruntime import RapidOCR

engine = RapidOCR()

img_path = 'tests/test_files/ch_en_num.jpg'
result, elapse = engine(img_path)
print(result)
print(elapse)