MinerU将PDF转成md文件,并分拣图片

首先自行安装python3,必须大于3.10以上的版本

博主是已经有了python3,这里就不演示了

1.Magic-PDF 安装方法

复制代码
conda create -n mineru python=3.12.8

如果之前安装 MinerU 时已创建过虚拟环境,可直接激活 是虚拟环境名mineru

复制代码
conda activate mineru

然后使用pip安装 Magic-PDF 完整版功能包

复制代码
pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com -i https://mirrors.aliyun.com/pypi/simple

2.下载模型文件

从 ModelScope 下载(官方推荐这里下载)

首先安装modelscope

复制代码
pip install modelscope

然后下载脚本文件

复制代码
https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models.py -O download_models.py

安装模型

复制代码
python download_models.py

从 Hugging Face 下载(可选)

安装huggingface_hub

复制代码
pip install huggingface_hub

接着下载下载脚本

复制代码
wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models_hf.py -O download_models_hf.py

安装模型

复制代码
python download_models_hf.py
相关推荐
AKAMAI35 分钟前
运维逆袭志·第1期 | 数据黑洞吞噬一切 :自建系统的美丽陷阱
运维·人工智能·云计算
还算善良_36 分钟前
【乐企板式文件生成工程】关于乐企板式文件(PDF/OFD/XML)生成工程介绍
xml·pdf
飞哥数智坊1 小时前
AI编程实战:AI要独立开发了?TRAE SOLO 后端生成能力深度实测
人工智能·trae
SamtecChina20232 小时前
应用科普 | 漫谈6G通信的未来
大数据·网络·人工智能·科技
Java与Android技术栈2 小时前
LLM + 图像处理的第一步:用自然语言驱动调色逻辑
图像处理·人工智能
F_D_Z2 小时前
计算机视觉的四项基本任务辨析
人工智能·计算机视觉
LetsonH2 小时前
⭐CVPR2025 MatAnyone:稳定且精细的视频抠图新框架
人工智能·python·深度学习·计算机视觉·音视频
格林威2 小时前
Baumer相机如何通过YoloV8深度学习模型实现工厂自动化产线牛奶瓶盖实时装配的检测识别(C#代码UI界面版)
人工智能·深度学习·数码相机·yolo·机器学习·计算机视觉·c#
Xyz_Overlord3 小时前
NLP——BERT模型全面解析:从基础架构到优化演进
人工智能·自然语言处理·bert·transformer·迁移学习
星期天要睡觉3 小时前
机器学习——K 折交叉验证(K-Fold Cross Validation),案例:逻辑回归 交叉寻找最佳惩罚因子C
人工智能·机器学习