PDF扫描版文字识别OCR

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github地址

https://github.com/hiroi-sora/Umi-OCR

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr

(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。

相关推荐
semantist@语校30 分钟前
第十九篇|东京世界日本语学校的结构数据建模:制度函数、能力矩阵与升学图谱
数据库·人工智能·线性代数·矩阵·prompt·github·数据集
qq_172805593 小时前
Go 语言 PDF 生成库综合比较与实践指南
开发语言·golang·pdf
IvorySQL5 小时前
版本发布| IvorySQL 4.6 发布
数据库·postgresql·开源·ivorysql
DisonTangor5 小时前
【阿里拥抱开源】Qwen团队开源新一代深度思考模型——Qwen3-Next-80B-A3B-Thinking
人工智能·学习·语言模型·开源·aigc
kevin 15 小时前
智能文档处理业务,应该选择大模型还是OCR专用小模型?
ocr
空影星5 小时前
Pot Translator,跨平台划词翻译与OCR工具
python·ocr·电脑
E_ICEBLUE5 小时前
如何使用 OCR 提取扫描件 PDF 的文本(Python 实现)
java·数据库·pdf
绝无仅有8 小时前
Redis高级面试题解析:深入理解Redis的工作原理与优化策略
后端·面试·github
绝无仅有8 小时前
Redis面试解答指南:了解Redis及其应用
后端·面试·github
掘金安东尼8 小时前
CSS 颜色混乱实验
前端·javascript·github