去年记录过《Windows 本地部署 MinerU PDF 文档提取神器》,当时安装使用还是 MinerU 还是 1.x 的版本,当时用的是 AMD 卡,所以只能用 CPU 进行推理解析,所需时间较久,时隔半年,由于业务需要,今天重新安装了最新版本:3.1.14-released,安装要求和过程出现了较大的变化,同时这次已经更换了 RTX 4090,所以可以使用 GPU 进行加速推理了。
这次是基于 uv 虚拟环境进行安装,如果没安装,建议先查看《Windows 安装 uv 并指定安装目录》。
安装方式有多种,我自己为了方便后续开发调整,这里选择的是通过源码安装。
环境信息
-
操作系统: Windows 11
-
显卡: RTX 4090
安装步骤
一、拉取源码
bash
git clone https://github.com/opendatalab/MinerU.git
cd MinerU
二、创建激活环境
bash
uv venv --python 3.12
.venv\Scripts\activate
三、执行安装命令
bash
uv pip install -e .[all] -i https://mirrors.aliyun.com/pypi/simple
四、安装 PyTorch
为了在 Windows 上能使用 CUDA 加速,通过 GPU 加快识别,否则默认使用 CPU,速度很慢。
PyTorch 的版本是需要根据你显卡型号来确定的,我这里是 RTX 4090,所以安装 CUDA 12.8 版本,具体安装命令可以访问 PyTorch 官方获取。
**请注意!!!**如果你本地同时存在 Anaconda 和 uv 多虚拟环境,安装命令前一定要加上 uv,不要直接使用 pip,否则可能会对虚拟环境造成污染!还有这步一定要等 MinerU 安装命令执行成功后在执行!
bash
uv pip install torch==2.11.0 torchvision==0.26.0 torchaudio==2.11.0 --index-url https://download.pytorch.org/whl/cu128
安装成功后会升级 MinerU 默认安装时的 Torch,可以看出默认安装的是不带 CUDA 版本的 Torch,所以一定要等 MinerU 安装命令执行成功后在执行才能使用 CUDA 加速。
bash
(mineru) D:\Projects\ai\mineru>uv pip install torch==2.11.0 torchvision==0.26.0 torchaudio==2.11.0 --index-url https://download.pytorch.org/whl/cu128
Resolved 14 packages in 4.39s
Uninstalled 2 packages in 1.07s
Installed 2 packages in 4.40s
- torch==2.8.0
+ torch==2.11.0+cu128
- torchvision==0.23.0
+ torchvision==0.26.0+cu128
五、启动并解析
首先将模型下载设置为国内的魔塔社区 ModelScope,否则默认是通过 HuggingFace,然后将需要识别的 PDF 放到 E:\pdf\input,这里根据自身情况调整即可,E:\pdf\output 为解析后输出的目录。
第一次运行会自动下载所需模型,这也是要设置下载源为国内可以正常访问魔塔社区的原因。
bash
SET MINERU_MODEL_SOURCE=modelscope
mineru -p E:\pdf\input -o E:\pdf\output
**请注意!!!**SET 命令设置的环境变量只在单次命令终端里有效,和 Linux 下的 export 命令一个效果,如果关闭或重新打开新终端需要重新执行才有效,嫌麻烦的需要调整源码,这里不过多阐述了。

解析是会自动对 E:\pdf\input 里所有文件进行解析,直到全部完成。

六、问题记录
如果出现报错:
bash
ValueError: CUDA is not available.

是因为 PyTorch 版本不带 CUDA ,详见"步骤四"。
如果出现报错:
bash
AssertionError: Can not find $env:CUDA_PATH

是因为本机电脑没有安装 CUDA Toolkit,需要下载并安装,然后重新打开命令终端,重新执行"步骤五"命令即可。


