PDF-Extract-Kit

环境安装

bash 复制代码
conda create -n pdf-extract-kit-1.0 python=3.10
conda activate pdf-extract-kit-1.0
pip install -r requirements.txt

网有点卡,每次下到一半就停了,回宿舍再试试

模型权重下载

官网

bash 复制代码
huggingface-cli download --resume-download opendatalab/PDF-Extract-Kit-1.0 --local-dir .

这个项目好像只能实现简单文本的,还不能拼接,复杂一点的需要使用MinerU

相关推荐
m5655bj1 小时前
C# 在 PDF 文档中添加电子签名
开发语言·pdf·c#
野生技术架构师1 小时前
2025年Java面试八股文大全(附PDF版)
java·面试·pdf
私人珍藏库2 小时前
[Windows] PDF 专业电子签章工具 v4.8
windows·pdf
无敌的黑星星4 小时前
office 批量word转pdf
pdf·word·vba
console.log('npc')4 小时前
vue3文件上传弹窗,图片pdf,word,结合预览kkview
前端·javascript·vue.js·pdf·word
优选资源分享4 小时前
PDF to IMG v1.0:批量PDF转图片工具
pdf·实用工具
办公自动化软件定制化开发python7 小时前
[特殊字符] 告别重复劳动!「报告自动生成工具」上线:一键批量生成 Word/PDF 报告,支持模板层级结构保存!
pdf·word
TTGGGFF7 小时前
实用代码工具:Python打造PDF选区OCR / 截图批量处理工具(支持手动/全自动模式)
python·pdf·ocr
诸葛大钢铁1 天前
如何拆分PDF文件?快速拆分PDF文件的2个方法
pdf·pdf拆分
CodeCraft Studio1 天前
国产化PDF处理控件Spire.PDF教程:在Java快速解析PDF文本、表格、图像和元数据
java·python·pdf·pdf解析·spire.pdf·元数据解析·java pdf解析