技术栈
解析pdf表格
java_强哥
19 小时前
spring boot
·
pdf
·
解析pdf表格
springboot+tabula解析pdf中的表格数据
在日常业务需求中,往往会遇到解析pdf数据获取文本的需求,常见的做法是使用 pdfbox 来做,但是它只适合做一些简单的段落文本解析,无法处理表格这种复杂类型,因为单元格中的文本有换行的情况,无法对应到我们业务具体的属性上面去。而 tabula 在它的基础上做了表格的特殊处理,使用案例如下: