RapidOCR - 兼容性广泛的多平台多语言OCR工具

更多AI开源软件:

AI开源 - 小众AIhttps://www.aiinn.cn/sources

RapidOCR是一款兼容性最为广泛的多平台多语言OCR工具,它完全开源免费,并支持离线环境下的快速部署。其核心亮点在于采用ONNXRuntime作为推理引擎,相比传统的PaddlePaddle推理引擎,速度实现了4至5倍的提升,同时彻底解决了内存泄露问题,确保了高效稳定的运行。

3200 Stars 378 Forks 10 Issues 23 贡献者 Apache-2.0 License Python 语言

代码: GitHub - RapidAI/RapidOCR: 📄 Awesome OCR multiple programing languages toolkits based on ONNXRuntime, OpenVINO and PaddlePaddle.

主页: RapidOCR 文档

主要功能

  • 跨平台支持:RapidOCR支持多种操作系统,包括但不限于Windows、Linux、MacOS、Android、iOS等,这使得用户可以在不同的设备和平台上使用RapidOCR进行光学字符识别。
  • 多语言识别:RapidOCR具备强大的多语言识别能力,默认支持中文和英文的识别,并且可以通过自定义转换实现对其他语言的支持。据相关介绍,RapidOCR可以识别超过60种语言的文本,这为用户处理多语种混合的文档提供了极大的便利。
  • 高性能推理:RapidOCR采用ONNXRuntime作为推理引擎,相比传统的PaddlePaddle推理引擎,速度提升了4至5倍,并且彻底解决了内存泄露问题,确保了高效稳定的运行。这使得RapidOCR在处理大规模文本识别任务时表现出色。

安装和使用

安装

复制代码
pip install rapidocr_onnxruntime

使用

复制代码
from rapidocr_onnxruntime import RapidOCR

engine = RapidOCR()

img_path = 'tests/test_files/ch_en_num.jpg'
result, elapse = engine(img_path)
print(result)
print(elapse)
相关推荐
白-胖-子1 小时前
深入剖析大模型在文本生成式 AI 产品架构中的核心地位
人工智能·架构
funfan05171 小时前
Claude4、GPT4、Kimi K2、Gemini2.5、DeepSeek R1、Code Llama等2025主流AI编程大模型多维度对比分析报告
ai编程
草梅友仁1 小时前
草梅 Auth 1.1.0 发布与最新动态 | 2025 年第 30 周草梅周报
开源·github·ai编程
LinXunFeng2 小时前
AI - Gemini CLI 摆脱终端限制
openai·ai编程·gemini
想要成为计算机高手2 小时前
11. isaacsim4.2教程-Transform 树与Odometry
人工智能·机器人·自动驾驶·ros·rviz·isaac sim·仿真环境
程序员X小鹿3 小时前
腾讯还是太全面了,限时免费!超全CodeBuddy IDE保姆级教程!(附案例)
ai编程
静心问道3 小时前
InstructBLIP:通过指令微调迈向通用视觉-语言模型
人工智能·多模态·ai技术应用
宇称不守恒4.03 小时前
2025暑期—06神经网络-常见网络2
网络·人工智能·神经网络
小楓12014 小时前
醫護行業在未來會被AI淘汰嗎?
人工智能·醫療·護理·職業
数据与人工智能律师4 小时前
数字迷雾中的安全锚点:解码匿名化与假名化的法律边界与商业价值
大数据·网络·人工智能·云计算·区块链