RapidOCR - 兼容性广泛的多平台多语言OCR工具

更多AI开源软件:

AI开源 - 小众AIhttps://www.aiinn.cn/sources

RapidOCR是一款兼容性最为广泛的多平台多语言OCR工具,它完全开源免费,并支持离线环境下的快速部署。其核心亮点在于采用ONNXRuntime作为推理引擎,相比传统的PaddlePaddle推理引擎,速度实现了4至5倍的提升,同时彻底解决了内存泄露问题,确保了高效稳定的运行。

3200 Stars 378 Forks 10 Issues 23 贡献者 Apache-2.0 License Python 语言

代码: GitHub - RapidAI/RapidOCR: 📄 Awesome OCR multiple programing languages toolkits based on ONNXRuntime, OpenVINO and PaddlePaddle.

主页: RapidOCR 文档

主要功能

  • 跨平台支持:RapidOCR支持多种操作系统,包括但不限于Windows、Linux、MacOS、Android、iOS等,这使得用户可以在不同的设备和平台上使用RapidOCR进行光学字符识别。
  • 多语言识别:RapidOCR具备强大的多语言识别能力,默认支持中文和英文的识别,并且可以通过自定义转换实现对其他语言的支持。据相关介绍,RapidOCR可以识别超过60种语言的文本,这为用户处理多语种混合的文档提供了极大的便利。
  • 高性能推理:RapidOCR采用ONNXRuntime作为推理引擎,相比传统的PaddlePaddle推理引擎,速度提升了4至5倍,并且彻底解决了内存泄露问题,确保了高效稳定的运行。这使得RapidOCR在处理大规模文本识别任务时表现出色。

安装和使用

安装

复制代码
pip install rapidocr_onnxruntime

使用

复制代码
from rapidocr_onnxruntime import RapidOCR

engine = RapidOCR()

img_path = 'tests/test_files/ch_en_num.jpg'
result, elapse = engine(img_path)
print(result)
print(elapse)
相关推荐
CodeJourney.8 分钟前
基于MATLAB的生物量数据拟合模型研究
人工智能·爬虫·算法·matlab·信息可视化
中电金信12 分钟前
中电金信参编的国家标准《信息技术 中间件 消息中间件技术要求》正式发布
人工智能
胡耀超24 分钟前
18.自动化生成知识图谱的多维度质量评估方法论
人工智能·python·自动化·知识图谱·数据科学·逻辑学·质量评估
虾球xz41 分钟前
游戏引擎学习第290天:完成分离渲染
c++·人工智能·学习·游戏引擎
暖季啊1 小时前
分割一切(SAM) 论文阅读:Segment Anything
论文阅读·人工智能·神经网络
可爱美少女1 小时前
Predict Podcast Listening Time-(回归+特征工程+xgb)
人工智能·数据挖掘·回归
深度学习入门1 小时前
学习深度学习是否要先学习机器学习?
人工智能·深度学习·神经网络·学习·机器学习·ai·深度学习入门
dog2501 小时前
BBR 的 buffer 动力学观感
人工智能·算法
python1562 小时前
使用Langfuse和RAGAS,搭建高可靠RAG应用
人工智能·windows·python
虾球xz2 小时前
游戏引擎学习第281天:在房间之间为摄像机添加动画效果
c++·人工智能·学习·游戏引擎