技术栈
mineru
weixin_37763484
12 天前
文档解析
·
mineru
【MinerU】 Docker 使用问答记录
定义在 pyproject.toml:110-120:具体来说,all 在 core 基础上额外安装:
weixin_37763484
13 天前
文档解析
·
mineru
【MinerU】 3090部署 CUDA版本升级
我在矩池云上租了3090,但是 CUDA 只有12.2, 当使用 MinerU 的 -b vlm-auto-engine时,官方文档上写着CUDA最低要12.9,当我询问 Gemini 如何升级的时候,给出的答案是只升级 CUDA Toolkit。
weixin_37763484
17 天前
docker
·
容器
·
mineru
【MinerU】 Docker Compose 使用
注意:Docker 部署仅支持 Linux 和 Windows WSL2,不支持 macOS。Docker Compose 需要 MinerU 的 Docker 镜像,需先构建。
weixin_37763484
17 天前
文档解析
·
mineru
【MinerU】API 服务与 Router服务
MinerU 提供 mineru-api 命令启动 FastAPI 服务,支持同步和异步两种处理模式:
weixin_37763484
17 天前
文档解析
·
mineru
【MinerU】多类型文件解析与模型管理
MinerU 目前支持以下文件格式:注意:只支持 Office Open XML 格式(.docx/.pptx/.xlsx),不支持旧版二进制格式(.doc/.ppt/.xls)。
weixin_37763484
17 天前
文档解析
·
mineru
·
昇腾910b
【MinerU】昇腾910B部署
npu.Dockerfile 是 MinerU 为华为昇腾(Ascend)NPU 加速卡专门提供的 Docker 构建文件,用于在昇腾硬件上运行 MinerU 的全部功能(pipeline、vlm-auto-engine、hybrid-auto-engine 等)。
耿雨飞
1 个月前
mineru
·
llm应用平台
MinerU 系列教程 | 第一课:走进 MinerU -- 核心功能与整体架构概览
MinerU 系列教程 第一篇本篇教程作为 模块一:基础入门与架构概览 的第一课,全面介绍 MinerU 的核心功能与整体架构。无论你是刚接触文档解析领域的新手,还是正在寻找高质量 PDF 解析方案的工程师,本文都将帮助你建立对 MinerU 的全局认知,为后续的实战操作打下坚实基础。
熊猫钓鱼>_>
2 个月前
人工智能
·
阿里云
·
架构
·
pdf
·
ocr
·
skill
·
mineru
MinerU的正确使用方式:如何解析PDF成标准化向量数据,以供AI大模型等场景应用
MinerU 是一款基于 InternVL架构 的轻量化视觉多模态模型(仅1.2B参数),专为高密度文档解析设计。它通过“视觉理解+语义分析”的双重能力,将复杂PDF(多栏排版、表格、公式、图文混排)精准转换为结构化数据(Markdown/JSON),为AI大模型训练、RAG系统和企业知识库构建提供高质量数据源。其纯CPU可运行的特性,大幅降低了智能文档处理的部署门槛。
Lw中
2 个月前
mineru
·
rag表格处理
RAG跨页表格怎么自动对齐合并?
在构建RAG系统时,我们常常面临一个棘手的问题:跨页表格的处理。当一份文档中的表格因为分页被拆散时,简单的OCR或文本提取只能得到零散的行列碎片,而丢失了表格的整体结构。这对于后续的语义检索和答案生成是灾难性的——一个完整的表格被拆成多段,检索系统无法理解其整体含义,大模型也无法准确回答涉及表格全局的问题。
韦东东
4 个月前
人工智能
·
大模型
·
部署
·
架构设计
·
mineru
·
双后端
MinerU2.5源码拆解:双后端架构设计与企业级部署实践
8月中旬的时候,我去MinerU的办公室交流过一次。当时对方有位工作人员表示,接下来会很快基于视觉模型的路线实现全面 SOTA。说实话,那个时候我还挺怀疑的。毕竟,那个时候MinerU2.0从6月中旬算起,已经发布了快两个月。但我在手头一些复杂布局的项目文档测试发现,实际和Textin这种闭源产品还是有不小差距。
阿里巴巴P8资深技术专家
4 个月前
ai
·
ocr
·
ai大模型
·
rag
·
文档解析
·
mineru
·
tike
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
FOAF-lambda
4 个月前
python
·
mineru
本地部署mineru-tianshu
项目链接 https://github.com/magicyuan876/mineru-tianshu/
java_logo
5 个月前
docker
·
容器
·
pdf
·
mineru
·
mineru部署
·
mineru部署文档
·
mineru部署教程
MinerU Docker 部署指南:PDF 结构化解析服务实践
MinerU 是一款面向开发者与科研用户的 PDF 结构化解析工具,专注于将 PDF 文档高质量地转换为机器可读格式(如 Markdown、JSON 等),以便于后续的检索、分析与二次加工。MinerU 起源于「书生·浦语」大模型预训练过程,核心目标是解决科技文献中复杂版式、符号与公式的高质量解析问题,在大模型时代为科研与工程应用提供可靠的数据基础。
cwity
5 个月前
claude
·
mineru
·
skills
claude-agent-sdk mineru-parser-skill发票识别
不谈玄学,只讲落地。 我是一名深耕算法工程化一线的实践者,擅长将 新技术、关键技术、AI/ML 技术从论文和 demo 转化为可规模化部署的生产系统。在这里,你看不到堆砌公式的理论空谈,只有真实项目中踩过的坑、趟过的路,每一篇文章都源自实战经验的提炼。我相信技术的价值在于解决真实问题,而不是制造焦虑。如果你也厌倦了"收藏即学会",渴望掌握让算法真正跑起来的硬核能力,那么这里就是你的技术补给站。
SCBAiotAigc
5 个月前
人工智能
·
python
·
mineru
MinerU离线推理
https://github.com/opendatalab/MinerU
水中加点糖
5 个月前
人工智能
·
二次开发
·
ai搜索
·
文档解析
·
ai知识库
·
ragflow
·
mineru
源码运行RagFlow并实现AI搜索(文搜文档、文搜图、视频理解)与自定义智能体(一)
众所周不知,RagFlow是由国内一家公司开源的一款软件,在AI知识库构建、智能体编排等场景中深受全球开发者的喜爱。 快速体验地址为:https://ragflow.io/
赋范大模型技术社区
5 个月前
agent
·
mineru
·
文档审核
·
hitl
·
langchain1.0
LanChain1.0实战:MinerU+HITL 打造字符级定位文档审核 Agent(附源码)
文档审核革命: 人工审查需要数天,AI仅需5秒,准确率超越人类专家!厌倦了耗时的文档审核?最新研究表明,先进的大语言模型(LLM)在法律问题识别上已超越人类专家,成本降低惊人的99.97%。本文基于LangChain 1.1 + DeepSeek-v3.2 + MinerU,构建企业级智能文档审核系统。
wxl781227
6 个月前
ocr
·
mineru
·
miner-api
·
pdf parser
如何部署自己的MinerU API OCR服务?
以下为兼容MacOS和Linux的部署步骤:1、准备Dockerfile2、准备compose.yaml
耿雨飞
6 个月前
mineru
·
pdf文件解析
·
rag 文档解析
Mineru 智能文档解析引擎-快速上手
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF。
X.Cristiano
8 个月前
人工智能
·
mineru
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型
MinerU2.5 是一个具有 12 亿参数的视觉-语言模型,用于文档解析,它在保持高计算效率的同时实现了最先进的准确性。它采用两阶段解析策略:首先对下采样的图像进行高效的全局布局分析,然后对文本、公式和表格的原分辨率裁剪部分进行细粒度的内容识别。通过大规模、多样化的数据引擎支持预训练和微调,MinerU2.5 在多个基准测试中始终优于通用模型和特定领域模型,同时保持较低的计算开销。