mineru

阿里巴巴P8资深技术专家13 小时前
ai·ocr·ai大模型·rag·文档解析·mineru·tike
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
FOAF-lambda6 天前
python·mineru
本地部署mineru-tianshu项目链接 https://github.com/magicyuan876/mineru-tianshu/
java_logo12 天前
docker·容器·pdf·mineru·mineru部署·mineru部署文档·mineru部署教程
MinerU Docker 部署指南:PDF 结构化解析服务实践MinerU 是一款面向开发者与科研用户的 PDF 结构化解析工具,专注于将 PDF 文档高质量地转换为机器可读格式(如 Markdown、JSON 等),以便于后续的检索、分析与二次加工。MinerU 起源于「书生·浦语」大模型预训练过程,核心目标是解决科技文献中复杂版式、符号与公式的高质量解析问题,在大模型时代为科研与工程应用提供可靠的数据基础。
cwity13 天前
claude·mineru·skills
claude-agent-sdk mineru-parser-skill发票识别不谈玄学,只讲落地。 我是一名深耕算法工程化一线的实践者,擅长将 新技术、关键技术、AI/ML 技术从论文和 demo 转化为可规模化部署的生产系统。在这里,你看不到堆砌公式的理论空谈,只有真实项目中踩过的坑、趟过的路,每一篇文章都源自实战经验的提炼。我相信技术的价值在于解决真实问题,而不是制造焦虑。如果你也厌倦了"收藏即学会",渴望掌握让算法真正跑起来的硬核能力,那么这里就是你的技术补给站。
SCBAiotAigc14 天前
人工智能·python·mineru
MinerU离线推理https://github.com/opendatalab/MinerU
水中加点糖17 天前
人工智能·二次开发·ai搜索·文档解析·ai知识库·ragflow·mineru
源码运行RagFlow并实现AI搜索(文搜文档、文搜图、视频理解)与自定义智能体(一)众所周不知,RagFlow是由国内一家公司开源的一款软件,在AI知识库构建、智能体编排等场景中深受全球开发者的喜爱。 快速体验地址为:https://ragflow.io/
赋范大模型技术社区20 天前
agent·mineru·文档审核·hitl·langchain1.0
LanChain1.0实战:MinerU+HITL 打造字符级定位文档审核 Agent(附源码)文档审核革命: 人工审查需要数天,AI仅需5秒,准确率超越人类专家!厌倦了耗时的文档审核?最新研究表明,先进的大语言模型(LLM)在法律问题识别上已超越人类专家,成本降低惊人的99.97%。本文基于LangChain 1.1 + DeepSeek-v3.2 + MinerU,构建企业级智能文档审核系统。
wxl7812271 个月前
ocr·mineru·miner-api·pdf parser
如何部署自己的MinerU API OCR服务?以下为兼容MacOS和Linux的部署步骤:1、准备Dockerfile2、准备compose.yaml
耿雨飞1 个月前
mineru·pdf文件解析·rag 文档解析
Mineru 智能文档解析引擎-快速上手MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF。
X.Cristiano3 个月前
人工智能·mineru
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型MinerU2.5 是一个具有 12 亿参数的视觉-语言模型,用于文档解析,它在保持高计算效率的同时实现了最先进的准确性。它采用两阶段解析策略:首先对下采样的图像进行高效的全局布局分析,然后对文本、公式和表格的原分辨率裁剪部分进行细粒度的内容识别。通过大规模、多样化的数据引擎支持预训练和微调,MinerU2.5 在多个基准测试中始终优于通用模型和特定领域模型,同时保持较低的计算开销。
Mocode5 个月前
pdf解析·mineru
【2025】Datawhale AI夏令营-多模态RAG-Task3笔记-解决方案进阶Task1、Task2笔记中记录了多模态RAG的任务难点:针对这3个任务难点,baseline方案的解决方案及不足分别如下:
用什么都重名6 个月前
人工智能·python·pdf·mineru·makedown
MinerU:高效智能PDF文档解析工具完全指南MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。
华尔街的幻觉6 个月前
mineru
解锁高难度PDF!MinerU部署保姆教程 + Dify联合解析《少年百科》复杂排版 PDF 的解析能力,已成为衡量企业文档自动化处理水平的重要指标之一。然而,在实际操作中,大多数企业并不具备自主研发 PDF 解析系统的能力,更多依赖于开源工具来完成这一任务。因此,选择一款功能强大、适配性强的 PDF 解析工具,显得尤为关键。
yumuing blog7 个月前
docker·pdf·ocr·markdown·dify·parse·mineru
实战指南:部署MinerU多模态文档解析API与Dify深度集成(实现解析PDF/JPG/PNG)MinerU 能够将包含图片、公式、表格等元素的多模态 PDF、PPT、DOCX 等文档转化为易于分析的 Markdown 格式。
漫游者Nova7 个月前
pdf·json·markdown·mineru
PDF转Markdown/JSON软件MinerU最新1.3.12版整合包下载MinerU发布至今我已经更新多版整合包了,5天前MinerU发布了第一个正式版1.0.1,并且看到在18小时之前有更新模型文件,我就做了个最新版的一键启动整合包。
梁萌8 个月前
ui·markdown·可视化·mineru·pdf转mk
MinerU安装(pdf转markdown、json)在Windows上安装MinerU,参考以下几个文章,可以成功安装,并使用GPU解析。整体安装教程:MinerU本地化部署教程——一款AI知识库建站的必备工具
渴望技术的猿8 个月前
java·windows·python·mineru
Windows 本地部署MinerU详细教程MinerU是一款由OpenDataLab开发的开源PDF转Markdown工具,可以高质量地提取PDF文档内容,生成结构化的Markdown格式文本。本指南将帮助您在本地部署并使用MinerU。
kv183010 个月前
pdf翻译·mineru·大模型翻译
介绍一款基于MinerU的PDF翻译工具Fast pdf translate是一款pdf翻译软件,基于MinerU实现pdf转markdown的功能,接着对markdown进行分割, 送给大模型翻译,最后组装翻译结果并由pypandoc生成结果pdf。
CIAS1 年前
pdf·mineru
Ubuntu 22.04 一键部署MinerU1.1.0MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF。
gold20081 年前
pdf·mineru·magic-pdf
MinerU magic-pdf 安装, pdf 转 markdown出现错误:原因:国内连不上 huggingface.co解决: 查找 '/api/models/'grep -R '/api/models/' /usr/local/py311/lib/python3.11/site-packages/huggingface_hub/ 发现:./hf_api.py: f"{self.endpoint}/api/models/{repo_id}"