PDF扫描版文字识别OCR

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github地址

https://github.com/hiroi-sora/Umi-OCR

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr

(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。

相关推荐
virtaitech2 小时前
OrionX GPU算力池助力AI OCR场景应用
人工智能·ai·ocr·gpu算力·ai算力资源池化
海绵波波1074 小时前
Zotero使用(一)PDF文件导入不会自动识别
pdf
2401_856926934 小时前
图片转PDF技巧揭秘:四款高效工具推荐!
学习·pdf·图片转pdf·图片转pdf工具
_xaboy6 小时前
开源项目低代码表单FormCreate中通过接口加载远程数据选项
低代码·开源·formcreate·低代码表单·低代码设计器
The Mr.Nobody8 小时前
打通最后一公里:使用CDN加速GitHub Page的访问
github
Amagi.9 小时前
如何将本地项目上传到GitHub(SSH连接)
github
alex180110 小时前
python实现多个pdf文件合并
java·python·pdf
AI浩10 小时前
OCR 通用端到端模型GOT
ocr
暴龙加瓦10 小时前
使用阿里OCR身份证识别
ocr
白总Server12 小时前
php语言基本语法
开发语言·ide·后端·golang·rust·github·php