17K star!开源免费的离线OCR工具

平时工作中,总会遇到想对图片内文字进行处理的情况,我们就来介绍一款开源、免费的离线OCR工具,它就是:Umi-OCR。

关于 Umi-OCR

Umi-OCR是开源、免费的离线OCR软件。支持截屏/粘贴/批量导入图片,段落排版/排除水印,扫描/生成二维码。项目内置多国语言库,方便切换。

Umi-OCR支持两种内核,一种是PaddleOCR,另一种是RapidOCR。

工具包括的主要功能有:

  • 截图OCR:识别图中的文字,还支持段落合并、鼠标划选等功能。
  • 批量OCR:支持批量导入本地图片并识别
  • 二维码:可截图/粘贴/拖入本地图片,读取其中的二维码、条形码
  • 文档识别:支持导入多种格式的文件进行识别。
  • 调用接口:支持CLI和HTTP接口

目前项目在GitHub已经获得17K+ star,项目发布时间不长,增长趋势在OCR类产品里是比较不错的。

为什么用 Umi-OCR

为什么要使用Umi-OCR呢,我们来说一说:

  • 开源免费:不是OCR工具用不起,而是开源更有性价比,不花钱,还不用看些乱七八糟的广告,难道不香么。
  • 开箱即用:安装后无需什么配置即可使用,快速上手。
  • 体验好:在机器效率不错的情况下,Umi-OCR效率很好,用本地工具总比用一些服务要方便很多。
  • 有可玩性:提供了HTTP接口,可以自己做一些扩展,如果还不满足,那也可以从源码下手。

如何使用 Umi-OCR

项目支持Windows7 x64 及以上,因此只有windows用户可以使用了。

首先在项目release页面可以下载安装包:

Paddle 引擎插件版性能好,速度快,占用率高,适合高配机器。Rapid 引擎插件版速度稍慢,内存占用低,适合低配机器,兼容性好。

图片OCR

这是最常用的功能了,提供了很多实用的功能设置,并且转换速度很不错,很快就能得到结果。

批量OCR

批量OCR可以帮助处理多个任务,还可以设置处理后动作,直接保存不同类型的结果文件。

文档识别

除了对图片,还可以对PDF等类型的文件进行OCR,也同样支持批量操作。支持的文件格式有:pdf, xps, epub, mobi, fb2, cbz

二维码

可截图/粘贴/拖入本地图片,读取其中的二维码、条形码

接口调用

可以启动本地的服务来提供HTTP的API接口,具体参考文档来使用:

github.com/hiroi-sora/...

项目信息

相关推荐
时光慢煮9 分钟前
基于 Flutter × OpenHarmony 图书馆管理系统之构建模块选择器(底部导航栏样式)
flutter·开源·openharmony
长行35 分钟前
Python|Windows 安装 DeepSpeed 安装方法及报错 Unable to pre-compile async_io 处理
windows·python·deepspeed
百锦再35 分钟前
python之路并不一马平川:带你踩坑Pandas
开发语言·python·pandas·pip·requests·tools·mircro
Python之栈35 分钟前
5款拖拽式Python GUI生成器助你快速打造炫酷界面
python
灏瀚星空35 分钟前
基于 Python 与 GitHub,打造个人专属本地化思维导图工具全流程方案(上)
开发语言·人工智能·经验分享·笔记·python·个人开发·visual studio
用什么都重名36 分钟前
「实战指南」使用 Python 调用大模型(LLM)
python·大模型·llm·api调用
是Dream呀36 分钟前
Python从0到100(一百):基于Transformer的时序数据建模与实现详解
开发语言·python·transformer
资源存储库36 分钟前
【笔记】如何修改一个conda环境的python版本?
笔记·python·conda
xcLeigh36 分钟前
AI的提示词专栏:Prompt 与 Python Pandas 的结合使用指南
人工智能·python·ai·prompt·提示词
草莓熊Lotso37 分钟前
Python 入门超详细指南:环境搭建 + 核心优势 + 应用场景(零基础友好)
运维·开发语言·人工智能·python·深度学习·学习·pycharm