MinerU容器构建教程

一、介绍

MinerU作为一款智能数据提取工具,其核心功能之一是处理PDF文档和网页内容,将其中的文本、图像、表格、公式等信息提取出来,并转换为易于阅读和编辑的格式(如Markdown)。在这个过程中,MinerU需要利用图像识别、文本识别(OCR)、布局分析等技术来理解和处理PDF文档和网页中的视觉信息。这些技术正是计算机视觉领域的重要组成部分。

二、构建流程

系统:Ubuntu系统,

显卡:3090,

显存:24G,cuda11.8

特别提示:使用显卡3060也可以(没尝试,感觉可以)

1.查看系统是否有Miniconda3的虚拟环境

conda -V

如果输入命令没有显示Conda版本号,则需要安装。

2.更新系统命令

输入下列命令将系统更新及系统下载

apt-get update && apt-get install ffmpeg libsm6 libxext6  -y

3.创建虚拟环境

  • 创建名称为MinerU的虚拟环境

    conda create -n MinerU python=3.8

  • 激活"MinerU"虚拟环境

    conda activate MinerU

4.下载模型

输入下列命令对MinerU模型进行下载(11G左右)

git clone https://gitclone.com/github.com/opendatalab/MinerU.git

进入模型文件

cd MinerU-master

5.下载依赖包

输入下列命令:

pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com

下载时间会很长,耐心等待,直到出现"Successfully"开头的下载结果

6.下载模型权重文件

输入下列命令进行下载:

git lfs install
git clone https://hf-mirror.com/opendatalab/PDF-Extract-Kit

更改权重文件路径(后面运行找不到权重,你也可以更改运行代码的获取权重文件路径):

cp -r /MinerU-madter/PDF-Extract-Kit/models  /tmp/

7.项目运行

"try.pdf"是本上传用于测试的文档,你可以根据自己所需上传自己的PDF文档。

输入下列命令:

magic-pdf --path "try.pdf"

解析结束:

查看结果文件:

相关推荐
B站计算机毕业设计超人几秒前
计算机毕业设计Hadoop+PySpark深度学习游戏推荐系统 游戏可视化 游戏数据分析 游戏爬虫 Scrapy 机器学习 人工智能 大数据毕设
大数据·人工智能·爬虫·spark·课程设计·数据可视化·推荐算法
HuggingAI22 分钟前
stable diffusion文生图
人工智能·stable diffusion·ai绘画
云端奇趣27 分钟前
Stable Diffusion 绘画技巧分享,适合新手小白的技巧分享
人工智能·stable diffusion
Jurio.28 分钟前
【SPIE单独出版审核,见刊检索稳定!】2024年遥感技术与图像处理国际学术会议(RSTIP 2024,11月29-12月1日)
大数据·图像处理·人工智能·深度学习·机器学习·计算机视觉·学术会议
真的是我228 分钟前
基于MATLAB课程设计-图像处理完整版
图像处理·人工智能·计算机视觉·matlab
不脱发的牧码人33 分钟前
C#实现傅里叶变换算法
人工智能·算法·机器学习·c#·傅里叶分析
0x21133 分钟前
[论文阅读]BERT-based Lexical Substitution
论文阅读·人工智能·bert
云起无垠35 分钟前
【论文速读】| PathSeeker:使用基于强化学习的越狱攻击方法探索大语言模型的安全漏洞
人工智能·语言模型
goTsHgo36 分钟前
自然语言处理——Hugging Face 详解
人工智能·机器学习·自然语言处理
算家云1 小时前
moffee模型部署教程
人工智能·python·github·markdown·nvidia·ppt·幻灯片制作