在昇腾910B服务上部署搭建适配PDF解析工具Mineru2.5开源项目

在昇腾910B服务上部署搭建适配PDF解析工具Mineru2.5开源项目

文章目录


一、在昇腾社区下载适用的mindie镜像并运行容器

昇腾社区

powershell 复制代码
docker run -itd \
  --shm-size=500g \
  --net=host \
  --privileged \
  --name mindie \
  --restart=always \
  --device=/dev/davinci4 \
  --device=/dev/davinci5 \
  --device=/dev/davinci_manager \
  --device=/dev/devmm_svm \
  --device=/dev/hisi_hdc \
  -v /usr/local/Ascend/driver/:/usr/local/Ascend/driver/ \
  -v /usr/local/Ascend/add-ons/:/usr/local/Ascend/add-ons/ \
  -v /usr/local/sbin/:/usr/local/sbin/ \
  -v /var/log/npu/slog/:/var/log/npu/slog \
  -v /var/log/npu/profiling/:/var/log/npu/profiling \
  -v /var/log/npu/dump/:/var/log/npu/dump \
  -v /var/log/npu/:/usr/slog \
  -v /etc/hccn.conf:/etc/hccn.conf \
  swr.cn-south-1.myhuaweicloud.com/ascendhub/mindie:2.0.RC1-800I-A2-py311-openeuler24.03-lts \
  /bin/bash

二、安装系统运行所需要的依赖

进入容器并执行

powershell 复制代码
yum install -y mesa-libGL mesa-libGL-devel libXrender libSM libXext tesseract tesseract-langpack-chi_sim

三、安装mineru所需python依赖并设置环境变量

由博主多次测试失败找到的版本号

报错列举一下

1、报错一

operator torchvision::nms does not exist

是这个torchvision和torch没有对应的结果

2、报错二

ERR00100 PTA call acl api failed

Error\]: The internal ACL of the system is incorrect. Rectify the fault based on the error information in the ascend log. EC0010: Failed to import Python module \[AttributeError: `np.float_` was removed in the NumPy 2.0 release. Use `np.float64` instead...\]. 这个是昇腾软件栈与NumPy 2.0不兼容 ##### 3、报错三 An error happened while trying to locate the files on the Hub and we cannot find the appropriate snapshot folder for the specified revision on the local disk. Please check your internet connection and try again. 这个是必需配置本地模型:export MINERU_MODEL_SOURCE=local ##### 4、报错四 ImportError: /usr/local/lib64/python3.11/site-packages/torch_npu/lib/libtorch_npu.so: undefined symbol: _ZNK5torch8autograd4Node4nameEv 这个是torch和torch_npu版本不匹配 [安装版本](https://gitee.com/ascend/pytorch/releases/tag/v7.1.0.2-pytorch2.5.1) ```powershell pip install torchvision==0.20.1 numpy==1.26.4 torch==2.5.1 accelerate==1.10.1 pip install torch_npu-2.5.1.post3-cp311-cp311-manylinux_2_17_aarch64.manylinux2014_aarch64.whl ``` 环境变量设置 ```powershell export MINERU_MODEL_SOURCE=local export HF_ENDPOINT=https://hf-mirror.com ``` #### 四、部署Mineru项目 core 模块是 MinerU 的核心依赖,包含了除vllm外的所有功能模块。安装此模块可以确保 MinerU 的基本功能正常运行 ```powershell pip install mineru[core] ``` 下载模型 ```powershell mineru-models-download ``` 下载源选择modelscope NPU支持跑pipeline #### 五、运行测试 mineru-gradio --device npu --server-name 0.0.0.0 --server-port 7860 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/f2108302b0264f1c8eff4e18d0710f78.png) ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/53e257811a4744c9b6edc611a4d7d77d.png) ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/099003cad6ef4a478afc4b1037e20c65.png)

相关推荐
诸神缄默不语1 天前
如何用Python处理文件:Word导出PDF & 如何用Python从Word中提取数据:以处理简历为例
python·pdf·word
i***66501 天前
SpringBoot实战(三十二)集成 ofdrw,实现 PDF 和 OFD 的转换、SM2 签署OFD
spring boot·后端·pdf
777VG1 天前
Vue3+vue3-pdf-app@1.0.3实现加载 .pdf文件
前端·javascript·vue.js·pdf
ComPDFKit1 天前
Salesforce原生PDF编辑的重要性:效率、合规性与用户体验
大数据·pdf·ux
Forever777777771 天前
PDF瘦身,告别WPS收费压缩PDF
python·深度学习·pdf·免费
FreeBuf_1 天前
高危Markdown转PDF漏洞,可通过Markdown前置元数据实现JS注入攻击(CVE-2025-65108,CVSS 10.0)
开发语言·javascript·pdf
q***48412 天前
SpringBoot实战(三十二)集成 ofdrw,实现 PDF 和 OFD 的转换、SM2 签署OFD
spring boot·后端·pdf
SEO-狼术2 天前
Direct PDF Printing to .NET Applications
pdf
zyplayer-doc3 天前
目录支持批量操作,文档增加可见范围、锁定功能,PDF查看优化,zyplayer-doc 2.5.8 发布啦!
数据库·人工智能·pdf·编辑器·飞书·石墨文档
2501_930707783 天前
如何使用C#代码在 PDF 文档添加页码
pdf