Umi-OCR图片批量识别工具教程

基于 PaddleOCR 。可识别图片,完全离线。截屏/批量导入图片,支持多国语言、合并段落。
(文末附安装下载地址)
演示版本

一、安装步骤

1、解压后将Umi-OCR.exe发送到桌面快捷方式

2、点击桌面快捷方式

3、正常启用

二、使用步骤

1、以批量文档OCR识别为例,将图片型的pdf拖入到左侧

2、设置要转换的页数,默认是识别所有的,我这里选择特定页数(第4页),如下图,点击页数后会跳出弹出框进行设置。

3、设置排版解析方案,我试了下,选择【单栏-总是换行】效果会更好,后续解析入库方便

4、点击【开始任务】,任务执行结束后查看记录

安装包下载地址https://pan.quark.cn/s/53201f885ea9?pwd=Z44u
提取码:Z44u

相关推荐
爱吃饼干的熊猫13 小时前
告别“机械扫描”:DeepSeek-OCR-2用“视觉因果流”让AI像人一样读懂文档
ocr
Luke Ewin14 小时前
部署DeepSeek-OCR-2
ocr·deepseek·deepseek-ocr-2
confiself14 小时前
DeepSeek-OCR 2: Visual Causal Flow学习
学习·ocr
AI周红伟15 小时前
周红伟 DeepSeek-OCR v2技术原理和架构,部署案例实操
ocr
Coovally AI模型快速验证1 天前
10亿参数刷新OCR记录:LightOnOCR-2如何以小博大?
人工智能·学习·yolo·3d·ocr·人机交互
zstar-_1 天前
DeepSeek-OCR-2:视觉编码器的小优化
ocr
mseaspring1 天前
DeepSeek-OCR 2:视觉因果流的突破
ocr
virtaitech1 天前
云平台一键部署【rednote-hilab/dots.ocr】多语言文档布局解析模型
人工智能·科技·ai·ocr·gpu·算力
安如衫1 天前
从 OCR 到多模态 VLM Agentic AI:智能文档问答的范式转移全解
人工智能·ocr·agent·cv·rag·vlm
PPIO派欧云1 天前
PPIO 上线 DeepSeek-OCR-2 ,支持一键私有化部署
人工智能·ocr