MinerU将PDF转成md文件,并分拣图片

首先自行安装python3,必须大于3.10以上的版本

博主是已经有了python3,这里就不演示了

1.Magic-PDF 安装方法

复制代码
conda create -n mineru python=3.12.8

如果之前安装 MinerU 时已创建过虚拟环境,可直接激活 是虚拟环境名mineru

复制代码
conda activate mineru

然后使用pip安装 Magic-PDF 完整版功能包

复制代码
pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com -i https://mirrors.aliyun.com/pypi/simple

2.下载模型文件

从 ModelScope 下载(官方推荐这里下载)

首先安装modelscope

复制代码
pip install modelscope

然后下载脚本文件

复制代码
https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models.py -O download_models.py

安装模型

复制代码
python download_models.py

从 Hugging Face 下载(可选)

安装huggingface_hub

复制代码
pip install huggingface_hub

接着下载下载脚本

复制代码
wget https://gcore.jsdelivr.net/gh/opendatalab/MinerU@master/scripts/download_models_hf.py -O download_models_hf.py

安装模型

复制代码
python download_models_hf.py
相关推荐
ZPC82109 小时前
ROS 2 手眼标定完整方案
人工智能·算法·性能优化·机器人
起个名字总是说已存在9 小时前
github开源AI技能:UI UX Pro Max智能设计系统生成器
人工智能·ui·开源·github
Oflycomm9 小时前
高通公司与Neura达成合作,重注人工智能机器人领域
人工智能·机器人·高通·wifi7·wifi模组
撬动未来的支点9 小时前
【神经网络核心】张量、正向传播(空间映射)、反向传播(调整映射参数)
人工智能·深度学习·神经网络
互联网志9 小时前
具身智能:从炫技到实干,开启产业化新征程
人工智能
小垣9 小时前
java调用yolo26n.onnx模型输出图像推理检测
java·人工智能·深度学习·onnx
新知图书9 小时前
React的预构建creat_agent模块详解
人工智能·ai agent·智能体·langgraph
做一个码农都是奢望9 小时前
计算机控制系统课程实验:车道保持
人工智能·数码相机
后端小肥肠9 小时前
写公众号没灵感?这个 50K Star 开源工具把热点主动推到我面前
人工智能·开源·资讯
Mintopia9 小时前
文档写不好,技术能力再强也容易被低估
人工智能