Umi-OCR制作双层PDF

一、打开软件

双击"Umi-OCR.exe"打开软件;

二、功能选择

1、选择"批量文档";

2、勾选"递归读取子文件夹";

3、选择"保存到:文档原目录";

4、勾选"layered.pdf 双层可搜索文档";

5、勾选"p.txt 纯文字格式";

6、勾选"忽略空白页";

三、运行任务

1、选择需制作PDF的文件夹,拖入程序左侧窗口,耐心等待文件载入;

2、点击"开始任务",耐心等待任务运行;

3、查看成果数据,双层PDF与同名TXT;

四、程序修改

原始软件在"保存到:文档原目录"模式下,输出的双层PDF与TXT会增加前缀、后缀,通过修改PY代码实现覆盖保存需求。

1、output_pdf_layered.py;

2、output_txt_plain.py;

3、BatchDOC.py

相关推荐
王莎莎-MinerU10 小时前
从 PDF 到知识资产:MinerU 文档解析如何成为企业 RAG 系统的“数据基石”
大数据·人工智能·pdf·个人开发
molihuan11 小时前
最新 将 MuPDF 编译到 Android 动态库 PDF解析渲染引擎
android·pdf
Muyuan19981 天前
27.RAG 系统中的上下文充分性判断:从 Chunk 数量、FAISS 距离到 LLM Relevance Gate
python·django·pdf·fastapi·faiss
开开心心就好1 天前
近200个工具的电脑故障修复合集
安全·智能手机·pdf·电脑·consul·memcache·1024程序员节
其实秋天的枫1 天前
2026年初中英语大纲词汇表1600词
经验分享·pdf
开开心心_Every1 天前
轻量级PDF阅读器,仅几M大小打开秒开
linux·运维·服务器·安全·macos·pdf·phpstorm
福大大架构师每日一题1 天前
ragflow v0.25.1 最新版发布:API 统一、PDF 解析性能大幅优化、连接器删除同步全面增强,更新要点一次看懂
pdf·ragflow
cosinmz2 天前
图片太多太乱怎么整理?分享一个我最近常用的图片转 PDF方法
经验分享·小程序·pdf
其实秋天的枫3 天前
2026年新高考英语大纲词汇表3500个电子版PDF(含正序版、乱序版和默写版)
经验分享·pdf
lijfrank3 天前
MacOS 下 VS Code + LaTeX + Skim 双向同步配置
vscode·macos·pdf·latex·mactex