mineru

kv18307 天前
pdf翻译·mineru·大模型翻译
介绍一款基于MinerU的PDF翻译工具Fast pdf translate是一款pdf翻译软件,基于MinerU实现pdf转markdown的功能,接着对markdown进行分割, 送给大模型翻译,最后组装翻译结果并由pypandoc生成结果pdf。
CIAS1 个月前
pdf·mineru
Ubuntu 22.04 一键部署MinerU1.1.0MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF。
gold20081 个月前
pdf·mineru·magic-pdf
MinerU magic-pdf 安装, pdf 转 markdown出现错误:原因:国内连不上 huggingface.co解决: 查找 '/api/models/'grep -R '/api/models/' /usr/local/py311/lib/python3.11/site-packages/huggingface_hub/ 发现:./hf_api.py: f"{self.endpoint}/api/models/{repo_id}"
救救孩子把4 个月前
ai·pdf·大模型·mineru
模型训练数据-MinerU一款Pdf转Markdown软件模型训练数据-MinerU一款Pdf转Markdown软件-说明MinerU是上海人工智能实验室OpenDataLab团队推出的开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。MinerU能将包含图片、公式、表格等元素的多模态PDF文档转化为易于分析的Markdown格式,支持从网页和电子书中提取内容,提高AI语料准备效率。MinerU具备高精度的PDF模型解析工具链,支持多种输入模型,自动识别乱码,保留文档结构,转换公式为LaTex,适用于学术、财务、法律等多个领域,支持CPU和GPU,兼容
伊织code8 个月前
pdf·markdown·mineru·magic-pdf·magic-doc
MinerU、Magic-PDF、Magic-DocMinerU 是一款一站式、开源、高质量的数据提取工具,主要包含以下功能:Magic-PDF 是一款将 PDF 转化为 markdown 格式的工具。支持转换本地文档或者位于支持S3协议对象存储上的文件。