Umi-OCR v2下载、安装、使用教程 (批量图片转文字工具)

前言

OCR图片转文字识别软件,完全离线。截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本。基于 PaddleOCR 。

一、下载地址

下载链接: http://source/download 选择如下图红色框文件内容下载

二、安装步骤

1、解压后将Umi-OCR.exe发送到桌面快捷方式

2、点击桌面快捷方式

3、正常启用

三、使用步骤

1、以批量文档OCR识别为例,将图片型的pdf拖入到左侧

2、设置要转换的页数,默认是识别所有的,我这里选择特定页数(第4页),如下图,点击页数后会跳出弹出框进行设置

3、设置排版解析方案,我试了下,选择【单栏-总是换行】效果会更好,后续解析入库方便

4、点击【开始任务】,任务执行结束后查看记录

总结

其他功能页感兴趣的小伙伴可以自己研究下,目前这个只有window版本,有一定的局限性,我目前用的项目场景是,用vue做个按钮触发一个.bat的脚本,然后将文件批量上传到这里,接着将解析后的文件进行解析入库

相关推荐
王莎莎-MinerU16 小时前
从 OCR 到 Context Engineering:用 MinerU 搭一个可复现文档解析评测
人工智能·深度学习·机器学习·pdf·ocr·个人开发
AI人工智能+18 小时前
往来港澳通行证识别系统,深度融合计算机视觉与自然语言处理,为“智慧口岸”和“数字政务”提供了强有力的技术支撑
人工智能·深度学习·ocr·往来港澳通行证识别
打小就很皮...18 小时前
基于 Python + LangChain + React 实现智能发票识别与验真系统实战
前端·react.js·langchain·ocr·发票识别
weixin_3077791318 小时前
从切片迷宫到结构化智能:AI Agent解析PDF的完整范式
图像处理·人工智能·python·自动化·ocr
天天代码码天天19 小时前
用 OpenCV 5 DNN 跑 PP-OCR:一个适合新手学习的 C++ 动态库 + C# 可视化测试项目
opencv·ocr·dnn·opencv5·ppocrv6
王莎莎-MinerU2 天前
面向大模型工作流的文档解析:从OCR到MinerU的深度技术指南
网络·ocr
ai_coder_ai2 天前
使用ocr实现自动化脚本
运维·自动化·ocr
番石榴AI2 天前
JiaJiaOCR-2.2.0:面向Java ocr的开源库
java·ocr
企业知识库布道者2 天前
从 OCR 到文档结构理解:MinerU-Popo 对 RAG 文档解析链路的补全
人工智能·ocr·私有化部署·知识库·rag·企业知识库
DevOpenClub2 天前
用 OCR、PDF 转文本和摘要接口构建 RAG 文档入库 Agent
数据库·pdf·ocr