PDF扫描版文字识别OCR

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github地址

https://github.com/hiroi-sora/Umi-OCR

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr

(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。

相关推荐
拾荒的小海螺4 小时前
开源项目:LTX2 高效可控的开源视频生成模型
开源·音视频
wenzhangli75 小时前
Ooder A2UI 第一性原理出发 深度解析核心逻辑
人工智能·开源
智慧地球(AI·Earth)6 小时前
DeepSeek架构新探索!开源OCR 2诞生!
架构·ocr
OpenBayes6 小时前
教程上新|DeepSeek-OCR 2公式/表格解析同步改善,以低视觉token成本实现近4%的性能跃迁
人工智能·深度学习·目标检测·机器学习·大模型·ocr·gpu算力
PPIO派欧云7 小时前
PPIO上线GLM-OCR:0.9B参数SOTA性能,支持一键部署
人工智能·ai·大模型·ocr·智谱
Java面试题总结7 小时前
基于 Java 的 PDF 文本水印实现方案(iText7 示例)
java·python·pdf
东华果汁哥7 小时前
【大模型 OCR】GLM-OCR 使用教程:从入门到部署
ocr
徐小夕@趣谈前端8 小时前
Web文档的“Office时刻“:jitword共建版2.0发布!让浏览器变成本地生产力
前端·数据结构·vue.js·算法·开源·编辑器·es6
傻啦嘿哟8 小时前
Python操作PDF页面详解:删除指定页的完整方案
开发语言·python·pdf
CoderJia程序员甲10 小时前
GitHub 热榜项目 - 日榜(2026-02-05)
ai·开源·大模型·github·ai教程