PDF扫描版文字识别OCR

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github地址

https://github.com/hiroi-sora/Umi-OCR

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr

(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。

相关推荐
寻月隐君1 小时前
Web3实战:Solana CPI全解析,从Anchor封装到PDA转账
后端·web3·github
算家计算1 小时前
6GB显存玩转SD微调!LoRA-scripts本地部署教程,一键炼出专属AI画师
人工智能·开源
风筝超冷2 小时前
PDF 转 Markdown
pdf
wxgnolux2 小时前
网页端 js 读取发票里的二维码信息(图片和PDF格式)
pdf·jsqr
Eiceblue2 小时前
C# 快速检测 PDF 是否加密,并验证正确密码
开发语言·pdf·c#·visual studio
耗不尽的先生2 小时前
【PDF PicKiller】PDF批量删除固定位置图片工具,默认解密,可去一般图、背景图、水印图!
pdf
时序数据说4 小时前
时序数据库IoTDB的UDF Sample算法在数据监控、故障预防的应用
大数据·数据库·开源·时序数据库·iotdb
南郁13 小时前
007-nlohmann/json 项目应用-C++开源库108杰
c++·开源·json·nlohmann·现代c++·d2school·108杰
weixin_4723394616 小时前
使用Python提取PDF元数据的完整指南
java·python·pdf
前端探险家16 小时前
vue2中使用jspdf插件实现页面自定义块pdf下载
pdf