一、问题描述
在工作中或多或少会遇到:需要将某份pdf中的图表数据提取出来,以便能够"修改使用"图表数据,比如某份研报中的条形图数据、或某论文中的图表数据
获取图表数据来二次作图或修改数据、引用数据
可将pdf中的图标提取出来,解决办法还有点复杂
1、数据格式都不是同一的
2、图表类型千差万别:条形图、折线图等
比如将下面的表格数据提取到excel
问题一:
如何将文件中所有统计图表批量转为excel?而不是一个个手动去敲?
问题二:
如何将带有非标准的各种情况的图表数据精确提取出来?而无错位无错误信息,且对应关系正确?
二、方法
市面上还没有成熟的解决方法
1、目前主要依赖人手敲(费时费力费眼睛,还容易出错)
大风车excel
这是可以将pdf中的图表数据精确解析到excel中,将复杂问题变得轻松简单
1、支持识别复杂的统计图表:条形图、圆饼图、折线图、热力图等常见图表解析
2、批量解析:上传pdf文件批量解析
3、可支持100页的pdf解析
4、计算速度:10min解析20个图表
5、全网第一家做统计图表数据提取
识别结果示例:
根据上面图片的数据,解析的excel结果:可以看到数据能够精准的被解析出来,即便有些图表没有标记数据,也能标记出大概的值返回,非常便于用户二次作图和拿到数据修改
大风车excel网站(打开即用,免注册):
私有化部署:请留言私信
其他问题欢迎随时交流