Umi-OCR v2下载、安装、使用教程 (批量图片转文字工具)

前言

OCR图片转文字识别软件,完全离线。截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本。基于 PaddleOCR 。

一、下载地址

下载链接: http://source/download 选择如下图红色框文件内容下载

二、安装步骤

1、解压后将Umi-OCR.exe发送到桌面快捷方式

2、点击桌面快捷方式

3、正常启用

三、使用步骤

1、以批量文档OCR识别为例,将图片型的pdf拖入到左侧

2、设置要转换的页数,默认是识别所有的,我这里选择特定页数(第4页),如下图,点击页数后会跳出弹出框进行设置

3、设置排版解析方案,我试了下,选择【单栏-总是换行】效果会更好,后续解析入库方便

4、点击【开始任务】,任务执行结束后查看记录

总结

其他功能页感兴趣的小伙伴可以自己研究下,目前这个只有window版本,有一定的局限性,我目前用的项目场景是,用vue做个按钮触发一个.bat的脚本,然后将文件批量上传到这里,接着将解析后的文件进行解析入库

相关推荐
wxl7812271 天前
如何部署自己的MinerU API OCR服务?
ocr·mineru·miner-api·pdf parser
赋范大模型技术社区2 天前
LangChain1.0 搭建法务合同审核 Agent(附源码)
langchain·ocr·agent·rag·文档审核·langchain1.0
paopao_wu3 天前
人脸检测与识别-InsightFace:向量相似性搜索Faiss
人工智能·yolo·目标检测·ocr·faiss
翔云 OCR API6 天前
人脸识别API开发者对接代码示例
开发语言·人工智能·python·计算机视觉·ocr
yangshuquan7 天前
使用 C# + IronOcr,轻松实现图片文字自动识别(OCR)和提取
c#·ocr·编程技巧·winforms
明知道的博客10 天前
解决WSL环境下DeepSeek-OCR运行时内存不足问题
python·ocr·deepseek·deepseek-ocr
模型启动机11 天前
DeepSeek OCR vs Qwen-3 VL vs Mistral OCR:谁更胜一筹?
人工智能·ai·大模型·ocr·deepseek
AI人工智能+11 天前
文档抽取技术结合OCR、NLP和计算机视觉,能智能提取PDF、扫描件等版式文档中的结构化数据
pdf·ocr·文档抽取
旗讯数字12 天前
纸质手写表格二次录入效率低?旗讯 OCR 技术方案与行业落地实践
ocr
Olafur_zbj12 天前
【AI】使用OCR处理pdf
数据库·pdf·ocr