MinerU将PDF转成md文件，并分拣图片

最懒的菜鸟2025-07-11 10:43

首先自行安装python3，必须大于3.10以上的版本

博主是已经有了python3，这里就不演示了

复制代码

conda create -n mineru python=3.12.8

如果之前安装 MinerU 时已创建过虚拟环境，可直接激活是虚拟环境名mineru

复制代码

conda activate mineru

然后使用pip安装 Magic-PDF 完整版功能包

复制代码

pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com -i https://mirrors.aliyun.com/pypi/simple

从 ModelScope 下载（官方推荐这里下载）

首先安装modelscope

复制代码

pip install modelscope

然后下载脚本文件

复制代码

https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models.py -O download_models.py

安装模型

复制代码

python download_models.py

从 Hugging Face 下载（可选）

安装huggingface_hub

复制代码

pip install huggingface_hub

接着下载下载脚本

复制代码

wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models_hf.py -O download_models_hf.py

安装模型

复制代码

python download_models_hf.py