一、问题描述
在工作中或多或少会遇到:需要将某份pdf中的表格数据提取出来,以便能够"修改使用"数据
可将pdf中的表格提取出来,解决办法还有点复杂
尤其涉及"pdf中表格不是标准的单元格"的时候,提取数据到excel不太容易
比如将下面的表格数据提取到excel
问题一:
如何将文件中所有表格批量转为excel?而不是一个个手动去敲?
问题二:
如何将带有非标准单元格的表格转为excel?而无错位无错误信息
二、方法
市面上已有的解决方法
1、第三方工具网站。可批量读取并解析pdf表格到excel
2、自己不断截图,然后找工具将图片解析为表格,再将每个excel合并在一起
3、将pdf转为word,然后复制粘贴word到excel
4、自己用手敲,当最强牛马
虽然市面上的pdf转excel方法很多,也存在一些缺点
1、对非标准单元格识别有限:像图中的表格不是很标准,容易出现乱码和错位的情况
2、不支持扫描件,不支持图片表格转excel
大风车excel
这是一款,专门解析非标准单元格表格的工具,一键将pdf中表格批量转为excel
1、支持识别复杂的表格
2、批量解析每个表格
3、可支持100页的pdf解析
4、计算速度:10min解析500个表格
5、pdf中表格越大,解析效果越好
识别结果示例:
根据上面图片的数据,解析的excel结果:可以看到即便存在格式不标准的表格,也能解析出来;表格原图也写入了excel中,方便比对和修正
网站(打开即用,免注册):
私有化部署:请留言私信
其他问题欢迎随时交流