PDF扫描版文字识别OCR

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github地址

https://github.com/hiroi-sora/Umi-OCR

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr

(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。

相关推荐
Codeking__1 小时前
Redis——基本通用命令
redis·git·github
独自破碎E1 小时前
下载 GitHub 仓库「单个文件夹」的方法
github
大厂技术总监下海2 小时前
“Today I Learned”(TIL):一种比写博客更可持续的知识沉淀习惯
大数据·开源·github
hanzengyi3 小时前
Mayan EDMS v4.10 设置支持中文(Web汉化+中文OCR)
ocr·mayan-edms
我要学好英语6 小时前
知网下载的.caj文件怎么转成.pdf文件
pdf
掘金安东尼7 小时前
⏰前端周刊第 448 期(2026年1月4日-1月10日)
前端·面试·github
NocoBase7 小时前
NocoBase 本周更新汇总:支持 Gemini-3 模型
人工智能·开源·零代码·无代码·版本更新
掘金安东尼8 小时前
向大家介绍《开发者博主联盟》🚀
前端·程序员·github
答案—answer8 小时前
开源项目:Three.js3D模型可视化编辑系统
javascript·3d·开源·开源项目·three.js·three.js编辑器
梅羽落9 小时前
fastapi速成2
python·github·fastapi