docker部署MinerU web api

MinerU能够将包含图片、公式、表格等元素的多模态PDF、PPT、DOCX等文档转化为易于分析的Markdown格式。

1 克隆MinerU的仓库

shell 复制代码
git clone https://github.com/opendatalab/MinerU.git

2 cd到projects/web-api

shell 复制代码
cd projects/web-api

3 在可以科学上网的情况下可以直接运行

shell 复制代码
docker build -t mineru-api .

4 如果不能科学上网,使用modelscope

修改requirement.txt,添加modelscope==1.25.0 ![[Pasted image 20250429165051.png]] 修改download_models.py,删掉所有旧代码,改成这个

python 复制代码
#!/usr/bin/env python
import os
from modelscope.hub.snapshot_download import snapshot_download

# 配置模型下载路径(Windows路径示例:r'C:\MinerU')
MAIN_MODEL_DIR = "/opt/"
os.makedirs(MAIN_MODEL_DIR, exist_ok=True)

if __name__ == "__main__":
    # PDF-Extract-Kit的模型下载(需替换为ModelScope对应ID)
    pdf_extract_patterns = [
        "models/Layout/YOLO/**",
        "models/MFD/YOLO/**",
        "models/MFR/unimernet_hf_small_2503/**",
        "models/OCR/paddleocr_torch/**",
    ]
    pdf_model_path = snapshot_download(
        'opendatalab/PDF-Extract-Kit-1.0',  # ModelScope模型ID
        allow_patterns=pdf_extract_patterns,
        cache_dir=os.path.join(MAIN_MODEL_DIR, "models"),
        revision='master'  # 指定模型版本
    )

    # LayoutReader模型下载(需替换为ModelScope对应模型)
    layout_model_path = snapshot_download(
        'ppaanngggg/layoutreader',  # 替换为实际ModelScope ID
        cache_dir=os.path.join(MAIN_MODEL_DIR, "layoutreader"),
        allow_patterns=["*.json", "*.safetensors"]
    )

    print(f"主模型目录:{pdf_model_path}")
    print(f"布局模型目录:{layout_model_path}")

再运行docker build -t mineru-api .

5 编写docker-compose.yml

yml 复制代码
services:
  mineru-api:
    image: mineru-api
    ports:
      - "8000:8000"
    stdin_open: true   # 对应 -i 参数
    tty: true          # 对应 -t 参数
    runtime: nvidia    # 使用 NVIDIA 容器运行时
    environment:
      - NVIDIA_VISIBLE_DEVICES=all  # 允许访问所有 GPU

6 如果没有nvidia的runtime,先备份自己的daemon.json文件(/etc/docker/),通过yum install -y nvidia-docker2安装,这个命令会生成一个新的daemon.json文件,覆盖掉原来旧的,安装后之后比较一下新旧两个daemon文件,合并在一起。

7 启动

shell 复制代码
systemctl daemon-reload
systemctl restart docker
docker compose up -d

8 访问localhost:8000/docs

相关推荐
catchadmin2 小时前
PHP 快速集成 ChatGPT 用 AI 让你的应用更聪明
人工智能·后端·chatgpt·php
编程武士5 小时前
从50ms到30ms:YOLOv10部署中图像预处理的性能优化实践
人工智能·python·yolo·性能优化
max5006006 小时前
基于Meta Llama的二语习得学习者行为预测计算模型
人工智能·算法·机器学习·分类·数据挖掘·llama
月疯7 小时前
OPENCV摄像头读取视频
人工智能·opencv·音视频
极客天成ScaleFlash7 小时前
极客天成让统一存储从云原生‘进化’到 AI 原生: 不是版本升级,而是基因重组
人工智能·云原生
王哥儿聊AI7 小时前
Lynx:新一代个性化视频生成模型,单图即可生成视频,重新定义身份一致性与视觉质量
人工智能·算法·安全·机器学习·音视频·软件工程
_pinnacle_7 小时前
打开神经网络的黑箱(三) 卷积神经网络(CNN)的模型逻辑
人工智能·神经网络·cnn·黑箱·卷积网络
Ada's7 小时前
深度学习在自动驾驶上应用(二)
人工智能·深度学习·自动驾驶
张较瘦_8 小时前
[论文阅读] 人工智能 + 软件工程 | 从“人工扒日志”到“AI自动诊断”:LogCoT框架的3大核心创新
论文阅读·人工智能·软件工程
lisw058 小时前
连接蓝牙时“无媒体信号”怎么办?
人工智能·机器学习·微服务