Umi-OCR制作双层PDF

一、打开软件

双击"Umi-OCR.exe"打开软件;

二、功能选择

1、选择"批量文档";

2、勾选"递归读取子文件夹";

3、选择"保存到:文档原目录";

4、勾选"layered.pdf 双层可搜索文档";

5、勾选"p.txt 纯文字格式";

6、勾选"忽略空白页";

三、运行任务

1、选择需制作PDF的文件夹,拖入程序左侧窗口,耐心等待文件载入;

2、点击"开始任务",耐心等待任务运行;

3、查看成果数据,双层PDF与同名TXT;

四、程序修改

原始软件在"保存到:文档原目录"模式下,输出的双层PDF与TXT会增加前缀、后缀,通过修改PY代码实现覆盖保存需求。

1、output_pdf_layered.py;

2、output_txt_plain.py;

3、BatchDOC.py

相关推荐
SEO-狼术19 小时前
Infragistics now supports .NET 10
pdf·.net
新缸中之脑20 小时前
用Gemma 4构建自托管OCR
人工智能·ocr
_张一凡20 小时前
【文档解析】一文学懂百度千帆OCR模型细节及本地部署
深度学习·ocr·文档解析·千帆ocr·rag文档解析·qianfan-ocr
琪伦的工具库20 小时前
批量PDF合并工具使用说明:批量合并与直接合并两种模式,拖拽排序/页面范围/遍历子目录/重名自动处理
数据结构·pdf·排序算法
琪伦的工具库21 小时前
批量PDF多页面合并工具使用说明:多页合并N合1/多文件合并,支持页码范围/矢量模式/DPI与布局边距
pdf
PieroPc21 小时前
销售单据 OCR 处理中心,Fastapi+Html, MiMo-V2-Omni、豆包怎理图片转Json数据
html·ocr·fastapi
weixin_4080996721 小时前
【实战教程】EasyClick 调用 OCR 文字识别 API(自动识别屏幕文字 + 完整示例代码)
前端·人工智能·后端·ocr·api·安卓·easyclick
weixin_6681 天前
OCR 模型深度对比分析报告 - AI分析
人工智能·ocr
weixin_408099671 天前
【完整教程】天诺脚本如何调用 OCR 文字识别 API?自动识别屏幕文字实战(附代码)
前端·人工智能·后端·ocr·api·天诺脚本·自动识别文字脚本
guslegend2 天前
第6节:OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用
人工智能·大模型·ocr·rag