PDF扫描版文字识别OCR

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github地址

https://github.com/hiroi-sora/Umi-OCR

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr

(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。

相关推荐
南风微微吹8 小时前
2026初级会计师考试历年真题及答案解析电子版pdf(2021-2025年)
pdf
OurBMC社区9 小时前
玩转OurBMC第二十七期:BMC POST CODE解读
开源·ourbmc
哥只是传说中的小白9 小时前
GrsaiApi官方正版字字动画插件!支持nano banana pro和gpt-image-2模型
人工智能·gpt·ai作画·开源·aigc·api
weixin_4410036410 小时前
教师资格证(教资)面试历年真题2017-2025全套PDF
pdf
码途漫谈12 小时前
DocuSeal 介绍:开源文档签署与处理平台
开源
IT召唤狮15 小时前
【bk-CMDB】腾讯开源蓝鲸配置管理平台 — 面向应用的CMDB标杆实现
开源
林恒smileZAZ15 小时前
前端如何让图片、视频、pdf等文件在浏览器直接下载而非预览
前端·pdf
_xaboy16 小时前
FormCreate 设计器 v6.3 正式发布:AI 表单助理3.0登场!
前端·vue.js·低代码·开源·表单设计器
字节跳动开源18 小时前
局中局!给 Agent 装上 OpenViking,它们竟然学会了“记仇”和“伪装”?
人工智能·开源·llm
2501_9307077818 小时前
使用C#代码压平 PDF 表单字段
数据库·pdf·c#