Umi-OCR制作双层PDF

一、打开软件

双击"Umi-OCR.exe"打开软件;

二、功能选择

1、选择"批量文档";

2、勾选"递归读取子文件夹";

3、选择"保存到:文档原目录";

4、勾选"layered.pdf 双层可搜索文档";

5、勾选"p.txt 纯文字格式";

6、勾选"忽略空白页";

三、运行任务

1、选择需制作PDF的文件夹,拖入程序左侧窗口,耐心等待文件载入;

2、点击"开始任务",耐心等待任务运行;

3、查看成果数据,双层PDF与同名TXT;

四、程序修改

原始软件在"保存到:文档原目录"模式下,输出的双层PDF与TXT会增加前缀、后缀,通过修改PY代码实现覆盖保存需求。

1、output_pdf_layered.py;

2、output_txt_plain.py;

3、BatchDOC.py

相关推荐
Mr -老鬼16 小时前
EasyclickOCR模块的正确用法
ocr·easyclick
半熟的皮皮虾19 小时前
又重新写了个PDF工具箱-转换office格式/合并/拆分/删除常见操作都有了
python·程序人生·pdf·flask·开源·json·学习方法
waterfeeling20 小时前
AGI 论文复现日记:攻克 PDF 解析的“第一公里”
pdf·agi
钟良堂21 小时前
Java开发OCR(自动识别图片中的文字)Tesseract-OCR + Tess4J 和 百度智能云OCR API
java·ocr·图片文字识别
qq_546937271 天前
PDF工具的天花板!PDF补丁丁:开源免费+无广告,支持Win7~Win11,批量OCR秒完成
pdf·ocr
小真zzz1 天前
ChatPPT免费功能之【导出PDF】:PPT内容安全+便捷分享
人工智能·ai·pdf·powerpoint·ppt·aippt
Rover Ramble2 天前
提取大型非扫描pdf文件的表格数据
pdf
2501_907136822 天前
电子礼簿系统-红白喜事记账工具,PDF/Execl导出
pdf·软件需求
E_ICEBLUE2 天前
零成本实现文档智能:本地化 OCR 提取与 AI 处理全流程实战
人工智能·ocr
AI人工智能+2 天前
智能表格识别技术:通过深度学习与版面分析相结合,解决传统OCR在复杂表格处理中的局限性
深度学习·ocr·表格识别