MinerU 是一款将PDF转化如markdown、json工具

MinerU

项目简介

MinerU是一款将PDF转化为机器可读格式的工具(如markdownjson),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发展做出贡献。 相比国内外知名商用产品MinerU还很年轻,如果遇到问题或者结果不及预期请到issue提交问题,同时附上相关PDF。

2、demo网址

点击

导入pdf文件使用,有示例pdf效果还挺好

3、吸引点

也就是按照PDF全部转换过来,

  • 保留原文档的结构,包括标题、段落、列表等
  • 提取图像、图片标题、表格、表格标题
  • 自动识别文档中的公式并将公式转换成latex

不足点:表格数据还是以图片的方式转过来的

相关推荐
weixin_584121434 小时前
vue3+ts导出PDF
javascript·vue.js·pdf
Access开发易登软件6 小时前
Access开发导出PDF的N种姿势,你get了吗?
后端·低代码·pdf·excel·vba·access·access开发
沐雪架构师11 小时前
Docling将pdf转markdown以及与AI生态集成
人工智能·pdf
kevin 111 小时前
扫描件、PDF、图片都能比对!让文档差异无所遁形
大数据·人工智能·pdf
algonaut12 小时前
adobe acrobat 安装到使用再到PDF编辑【适合小白,只看一篇就够!!!】
java·开发语言·其他·pdf
拓端研究室16 小时前
专题:2025电力行业5G工厂及绿色转型、市场机制研究报告|附100+份报告PDF、数据仪表盘汇总下载
5g·pdf
zlpzlpzyd19 小时前
jodconverter将word转pdf底层libreoffice的问题
pdf·word
2501_928094651 天前
PDF Reader 编辑阅读工具(Mac中文)
macos·pdf·mac
非凡ghost1 天前
PDF24 Creator:免费的多功能PDF工具
学习·pdf·生活·软件需求