Umi-OCR v2下载、安装、使用教程 (批量图片转文字工具)

不称职的程序员❦2024-07-13 14:43

前言

OCR图片转文字识别软件，完全离线。截屏/批量导入图片，支持多国语言、合并段落、竖排文字。可排除水印区域，提取干净的文本。基于 PaddleOCR 。

一、下载地址

下载链接: http://source/download 选择如下图红色框文件内容下载

二、安装步骤

1、解压后将Umi-OCR.exe发送到桌面快捷方式

2、点击桌面快捷方式

3、正常启用

三、使用步骤

1、以批量文档OCR识别为例，将图片型的pdf拖入到左侧

2、设置要转换的页数，默认是识别所有的，我这里选择特定页数（第4页），如下图，点击页数后会跳出弹出框进行设置

3、设置排版解析方案，我试了下，选择【单栏-总是换行】效果会更好，后续解析入库方便

4、点击【开始任务】，任务执行结束后查看记录

总结

其他功能页感兴趣的小伙伴可以自己研究下，目前这个只有window版本，有一定的局限性，我目前用的项目场景是，用vue做个按钮触发一个.bat的脚本，然后将文件批量上传到这里，接着将解析后的文件进行解析入库

上一篇：初学SpringMVC之使用注解开发

下一篇：数据挖掘——matplotlib

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 年 AI 大模型 & AI 编程工具实战全总结 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？102026年AI技术突破与产业落地全景：从GPT-5到多模态智能体的新纪元