Umi-OCR:Windows7和Linux上可免费离线使用的OCR应用!

工具介绍

Umi-OCR 是一款免费、开源的离线OCR软件,主要由作者 hiroi-sora 用业余时间在开发和维护。

Umi-OCR 内置多国语言库,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚以及二维码的扫描/生成。

适用平台:Windows7 x64Linux x64

Umi-OCR 具有以下核心优势和特色功能👇

  • 免费:本项目所有代码开源,完全免费
  • 方便:解压即用,离线运行,无需网络
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库
  • 灵活:支持命令行、HTTP接口等外部调用方式
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

Linux x64 部署

Linux x64 部署教程(可以基于Docker部署)请参考:https://github.com/hiroi-sora/Umi-OCR_runtime_linux

Linux x64 已通过作者测试的系统:

👉 主机部署:Ubuntu 22.04 / Debian 12.5 / Kali 2023.3

👉 Docker 部署:CentOS 7

主机部署

Umi-OCR_Linux_Paddle_2.1.5.tar.xz (264.5MB)

bash 复制代码
SHA256: 7ff32e5dc818d67171820545100433c86e7e71155f9bad0851fad2ced9588f9b

首次运行请在命令行中执行 ./umi-ocr.sh ,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。

Docker部署

请按照文档提供的步骤进行:https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md

Windows7 x64 部署

不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

一、Paddle 引擎插件版

特点:性能好,速度快,占用率高,适合高配机器(不兼容奔腾、赛扬、凌动CPU)

⚠️重要提示:如果执行OCR时报错 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本

Umi-OCR_Paddle_v2.1.5.7z.exe (128MB)

bash 复制代码
SHA256: abe00248d6e68dda75029739751ad7258f0ecc14d720b19240a844f5341859b2

二、Rapid 引擎插件版

特点:速度稍慢,内存占用低,适合低配机器,兼容性好

Umi-OCR_Rapid_v2.1.5.7z.exe (98.5MB)

bash 复制代码
SHA256: 659c55896c32a5e019dc7bde1713d0e5c73186a2c653bed84c4480fa1795b722

更多下载途径: 蓝奏云 | SourceForge | Scoop

比如通过SourceForge,选择Paddle 引擎插件版进行.exe文件的下载。

功能使用

中文用户可以在应用安装成功之后,在「全局设置」中将默认的英文语言修改为中文。

在「功能页」,我们可以看到应用提供的核心功能。

我们试试截图OCR的效果吧~

截图可以通过拖入和粘贴这两种方式进行导入,我这边选择了一篇wechat公众号文章(谷歌AI掌门人亲述:十年内终结疾病?揭秘99%人不知道的AI革命真相‌)里带文字的一张图片:

除了最上方花式字体的双引号识别成了"GG",其他英文识别还是没有问题的。

识别完成后,我们可以全选OCR识别出来的文字内容进行复制。

使用感受分享

不知道是不是我的打开方式不对,虽然简单测试下的效果还不错,但整体使用感受并不不算特别丝滑~总觉得卡卡的,可能是运行的服务器性能不够?

Anyway,作者利用自己的业余时间开发维护这样一个可以本地离线使用的OCR软件并开源分享给大家已经很棒啦~有需要的朋友可以下载尝试看看!

相关推荐
大白的编程日记.18 小时前
【Linux学习笔记】线程概念和控制(二)
linux·笔记·学习
jerryinwuhan19 小时前
VIM和Linux命令速查表
linux·编辑器·vim
小白银子19 小时前
零基础从头教学Linux(Day 45)
linux·运维·junit·openresty
穷人小水滴19 小时前
笔记本 光驱 的内部结构及用法: 应急系统启动 (恢复) 光盘 (DVD+R/RW)
linux
半梦半醒*20 小时前
nginx反向代理和负载均衡
linux·运维·nginx·centos·tomcat·负载均衡
喜欢你,还有大家20 小时前
集群的概述和分类和负载均衡集群
运维·负载均衡
liu****20 小时前
负载均衡式的在线OJ项目编写(六)
运维·c++·负载均衡·个人开发
青草地溪水旁21 小时前
pthread_create详解:打开多线程编程的大门
linux·c/c++
Elastic 中国社区官方博客1 天前
CI/CD 流水线与 agentic AI:如何创建自我纠正的 monorepos
大数据·运维·数据库·人工智能·搜索引擎·ci/cd·全文检索
A-刘晨阳1 天前
Linux安装centos8及基础配置
linux·运维·服务器·操作系统·centos8