环境安装
bash
conda create -n pdf-extract-kit-1.0 python=3.10
conda activate pdf-extract-kit-1.0
pip install -r requirements.txt
网有点卡,每次下到一半就停了,回宿舍再试试
模型权重下载
bash
huggingface-cli download --resume-download opendatalab/PDF-Extract-Kit-1.0 --local-dir .
这个项目好像只能实现简单文本的,还不能拼接,复杂一点的需要使用MinerU