mineru

weixin_3776348412 天前
文档解析·mineru
【MinerU】 Docker 使用问答记录定义在 pyproject.toml:110-120:具体来说,all 在 core 基础上额外安装:
weixin_3776348413 天前
文档解析·mineru
【MinerU】 3090部署 CUDA版本升级我在矩池云上租了3090,但是 CUDA 只有12.2, 当使用 MinerU 的 -b vlm-auto-engine时,官方文档上写着CUDA最低要12.9,当我询问 Gemini 如何升级的时候,给出的答案是只升级 CUDA Toolkit。
weixin_3776348417 天前
docker·容器·mineru
【MinerU】 Docker Compose 使用注意:Docker 部署仅支持 Linux 和 Windows WSL2,不支持 macOS。Docker Compose 需要 MinerU 的 Docker 镜像,需先构建。
weixin_3776348417 天前
文档解析·mineru
【MinerU】API 服务与 Router服务MinerU 提供 mineru-api 命令启动 FastAPI 服务,支持同步和异步两种处理模式:
weixin_3776348417 天前
文档解析·mineru
【MinerU】多类型文件解析与模型管理MinerU 目前支持以下文件格式:注意:只支持 Office Open XML 格式(.docx/.pptx/.xlsx),不支持旧版二进制格式(.doc/.ppt/.xls)。
weixin_3776348417 天前
文档解析·mineru·昇腾910b
【MinerU】昇腾910B部署npu.Dockerfile 是 MinerU 为华为昇腾(Ascend)NPU 加速卡专门提供的 Docker 构建文件,用于在昇腾硬件上运行 MinerU 的全部功能(pipeline、vlm-auto-engine、hybrid-auto-engine 等)。
耿雨飞1 个月前
mineru·llm应用平台
MinerU 系列教程 | 第一课:走进 MinerU -- 核心功能与整体架构概览MinerU 系列教程 第一篇本篇教程作为 模块一:基础入门与架构概览 的第一课,全面介绍 MinerU 的核心功能与整体架构。无论你是刚接触文档解析领域的新手,还是正在寻找高质量 PDF 解析方案的工程师,本文都将帮助你建立对 MinerU 的全局认知,为后续的实战操作打下坚实基础。
熊猫钓鱼>_>2 个月前
人工智能·阿里云·架构·pdf·ocr·skill·mineru
MinerU的正确使用方式:如何解析PDF成标准化向量数据,以供AI大模型等场景应用MinerU 是一款基于 InternVL架构 的轻量化视觉多模态模型(仅1.2B参数),专为高密度文档解析设计。它通过“视觉理解+语义分析”的双重能力,将复杂PDF(多栏排版、表格、公式、图文混排)精准转换为结构化数据(Markdown/JSON),为AI大模型训练、RAG系统和企业知识库构建提供高质量数据源。其纯CPU可运行的特性,大幅降低了智能文档处理的部署门槛。
Lw中2 个月前
mineru·rag表格处理
RAG跨页表格怎么自动对齐合并?在构建RAG系统时,我们常常面临一个棘手的问题:跨页表格的处理。当一份文档中的表格因为分页被拆散时,简单的OCR或文本提取只能得到零散的行列碎片,而丢失了表格的整体结构。这对于后续的语义检索和答案生成是灾难性的——一个完整的表格被拆成多段,检索系统无法理解其整体含义,大模型也无法准确回答涉及表格全局的问题。
韦东东4 个月前
人工智能·大模型·部署·架构设计·mineru·双后端
MinerU2.5源码拆解:双后端架构设计与企业级部署实践8月中旬的时候,我去MinerU的办公室交流过一次。当时对方有位工作人员表示,接下来会很快基于视觉模型的路线实现全面 SOTA。说实话,那个时候我还挺怀疑的。毕竟,那个时候MinerU2.0从6月中旬算起,已经发布了快两个月。但我在手头一些复杂布局的项目文档测试发现,实际和Textin这种闭源产品还是有不小差距。
阿里巴巴P8资深技术专家4 个月前
ai·ocr·ai大模型·rag·文档解析·mineru·tike
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
FOAF-lambda4 个月前
python·mineru
本地部署mineru-tianshu项目链接 https://github.com/magicyuan876/mineru-tianshu/
java_logo5 个月前
docker·容器·pdf·mineru·mineru部署·mineru部署文档·mineru部署教程
MinerU Docker 部署指南:PDF 结构化解析服务实践MinerU 是一款面向开发者与科研用户的 PDF 结构化解析工具,专注于将 PDF 文档高质量地转换为机器可读格式(如 Markdown、JSON 等),以便于后续的检索、分析与二次加工。MinerU 起源于「书生·浦语」大模型预训练过程,核心目标是解决科技文献中复杂版式、符号与公式的高质量解析问题,在大模型时代为科研与工程应用提供可靠的数据基础。
cwity5 个月前
claude·mineru·skills
claude-agent-sdk mineru-parser-skill发票识别不谈玄学,只讲落地。 我是一名深耕算法工程化一线的实践者,擅长将 新技术、关键技术、AI/ML 技术从论文和 demo 转化为可规模化部署的生产系统。在这里,你看不到堆砌公式的理论空谈,只有真实项目中踩过的坑、趟过的路,每一篇文章都源自实战经验的提炼。我相信技术的价值在于解决真实问题,而不是制造焦虑。如果你也厌倦了"收藏即学会",渴望掌握让算法真正跑起来的硬核能力,那么这里就是你的技术补给站。
SCBAiotAigc5 个月前
人工智能·python·mineru
MinerU离线推理https://github.com/opendatalab/MinerU
水中加点糖5 个月前
人工智能·二次开发·ai搜索·文档解析·ai知识库·ragflow·mineru
源码运行RagFlow并实现AI搜索(文搜文档、文搜图、视频理解)与自定义智能体(一)众所周不知,RagFlow是由国内一家公司开源的一款软件,在AI知识库构建、智能体编排等场景中深受全球开发者的喜爱。 快速体验地址为:https://ragflow.io/
赋范大模型技术社区5 个月前
agent·mineru·文档审核·hitl·langchain1.0
LanChain1.0实战:MinerU+HITL 打造字符级定位文档审核 Agent(附源码)文档审核革命: 人工审查需要数天,AI仅需5秒,准确率超越人类专家!厌倦了耗时的文档审核?最新研究表明,先进的大语言模型(LLM)在法律问题识别上已超越人类专家,成本降低惊人的99.97%。本文基于LangChain 1.1 + DeepSeek-v3.2 + MinerU,构建企业级智能文档审核系统。
wxl7812276 个月前
ocr·mineru·miner-api·pdf parser
如何部署自己的MinerU API OCR服务?以下为兼容MacOS和Linux的部署步骤:1、准备Dockerfile2、准备compose.yaml
耿雨飞6 个月前
mineru·pdf文件解析·rag 文档解析
Mineru 智能文档解析引擎-快速上手MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF。
X.Cristiano8 个月前
人工智能·mineru
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型MinerU2.5 是一个具有 12 亿参数的视觉-语言模型,用于文档解析,它在保持高计算效率的同时实现了最先进的准确性。它采用两阶段解析策略:首先对下采样的图像进行高效的全局布局分析,然后对文本、公式和表格的原分辨率裁剪部分进行细粒度的内容识别。通过大规模、多样化的数据引擎支持预训练和微调,MinerU2.5 在多个基准测试中始终优于通用模型和特定领域模型,同时保持较低的计算开销。