PDF-Extract-Kit

环境安装

bash 复制代码
conda create -n pdf-extract-kit-1.0 python=3.10
conda activate pdf-extract-kit-1.0
pip install -r requirements.txt

网有点卡,每次下到一半就停了,回宿舍再试试

模型权重下载

官网

bash 复制代码
huggingface-cli download --resume-download opendatalab/PDF-Extract-Kit-1.0 --local-dir .

这个项目好像只能实现简单文本的,还不能拼接,复杂一点的需要使用MinerU

相关推荐
一位代码2 分钟前
python | PyPDF2 实现 pdf 的拆分与合并
pdf
百事牛科技15 小时前
保护文档安全:PDF限制功能实操方法
windows·pdf
琪伦的工具库1 天前
批量PDF文件加密工具使用说明:固定密码或随机密码批量加密PDF,权限控制+导出密码记录
运维·服务器·pdf
其实秋天的枫1 天前
【26专四】英语专业四级TEM4历年真题及答案解析电子版PDF(2009-2025年)
经验分享·pdf
优化控制仿真模型1 天前
26年初中中考英语大纲词汇1600个电子版PDF
经验分享·pdf
优化控制仿真模型1 天前
【26专四】英语专业四级TEM4历年真题及答案电子版PDF(2009-2025年)
经验分享·pdf
一位代码1 天前
python | 使用 pdfplumber 库提取 pdf 中的所有超链接
pdf
许彰午1 天前
# Excel转PDF合并单元格边框错乱?jxl+iText逐格解析样式,政务报表精准还原方案
前端·javascript·pdf
Godson_beginner1 天前
Aspose.PDF for Java(实现PDF转Word无水印无页数限制)
java·spring·pdf·文档转换
SEO-狼术2 天前
Infragistics now supports .NET 10
pdf·.net