PDF-Extract-Kit

环境安装

bash 复制代码
conda create -n pdf-extract-kit-1.0 python=3.10
conda activate pdf-extract-kit-1.0
pip install -r requirements.txt

网有点卡,每次下到一半就停了,回宿舍再试试

模型权重下载

官网

bash 复制代码
huggingface-cli download --resume-download opendatalab/PDF-Extract-Kit-1.0 --local-dir .

这个项目好像只能实现简单文本的,还不能拼接,复杂一点的需要使用MinerU

相关推荐
梵克之泪7 小时前
批量拆分PDF只取PDF的首页,批量按文件页数拆分PDF,按卷内目录页码表计算批量拆分分割PDF
pdf·pdf拆分
aisifang0012 小时前
PDF转Word神器:Gemini3.1Pro一键搞定文档处理
人工智能·pdf·word
盘古工具21 小时前
【分享】打开PDF文件的几种方式
windows·pdf
优化控制仿真模型1 天前
2026年初中英语考纲词汇表(1600词)PDF电子版
经验分享·pdf
蚁库1 天前
PDF编辑神器,一款软件搞定PDF所有问题!
pdf
狠学嵌入式1 天前
为了干翻WPS,我开发了个免费PDF处理网站
pdf
李李李勃谦1 天前
鸿蒙PC打造电子书阅读器:支持 EPUB/PDF、书签同步、笔记管理
笔记·华为·pdf·harmonyos
PaperData2 天前
2000-2025年《中国县域统计年鉴》pdf+excel版(附赠面板数据)
数据库·人工智能·数据分析·pdf·经管
狐狐生风2 天前
LangChain实现简易版-----PDF 文档问答机器人
人工智能·langchain·机器人·pdf·prompt
王莎莎-MinerU2 天前
从 PDF 到知识资产:MinerU 文档解析如何成为企业 RAG 系统的“数据基石”
大数据·人工智能·pdf·个人开发