poi-tl+kkviewfile实现生成pdf业务报告

需求背景,需要把ai生成的一些业务数据,生成一份pdf报告

需求分析

简单来说,就是json生成pdf的方案。

  1. 直接生成pdf。适合一些pdf样式简单的场景,一般就是纯文本按序渲染,或者是纯表格。如果需要一些复杂的排布,比如图片、水印、页眉页脚之类的,用pdf直接渲染的话就会复杂很多,而且后续有个什么改动,都很麻烦。我试了一下初步排除了这个方案。
  2. 先生成word,之后再word转pdf。先说缺点,word转pdf需要引入额外的服务,会比较重。但事情都是一体两面的,是缺点的同时也是优点,json生成word的技术,和word转pdf的技术都是比较成熟的,效果也不错,市面上都有很优秀的开源包或者开源系统可以使用。属于一种一劳永逸的方案吧。

方案选择

最后的方案是

  1. json生成word,采用poi-tl,一款简单好用的word模板渲染工具。大部分的样式都可以在word上提前用占位符的方式写好,代码层面只需要做数据填充即可,不用在后端代码里做样式渲染这种事情。(当然,部分场景也避免不了,不可能完全解耦)。基础用法不做赘述,官方文档很详细。后面会补一些我自己遇到的小问题。
  2. 第二步,word转pdf。这一步试了几种方案。aspose 收费且有水印,排除;jacob 不支持linux,排除;jodconverter+openOffice 效果不错且免费,但是openoffice不适合与业务服务部署在一起,单独部署的话需要再包一层,成本会略大。但好在这个事情有人已经做过了,kkviewfile就是市面上基于openoffice而开源的一个pdf预览转换服务。github上也有详细的部署文档,不做赘述。

使用过程中的几个小问题

  1. poi-tl种的区块对是一个很好用的原生插件,但是如果想在区块对中嵌套一些其他样式,比如列表的话,直接使用不会生效,需要额外指定。
java 复制代码
// 比如这里的events是一个事件列表占位符名称,NumberingRenderPolicyEva是我自定义的一个列表插件
builder.bind("events", new NumberingRenderPolicyEva()).build();
  1. word转pdf的时候,有些样式会有偏差,首先是因为word和pdf的格式不会是完全兼容的,一些隐藏的属性,在word中的展示和pdf中完全不一样。大部分属性都是可以在word中设置或者poi中指定的(poi会暴露常见的属性),比如我遇到的一个问题:word中设置好指定的行距,到了pdf中会失效,变成固定的行距,明显宽了很多,导致页数增加。
    试了几个样式,发现只有页眉没问题,所以确定是预设样式的属性原因。

    最后发现是这个属性的问题
    当然,还有一些隐藏更深的属性,可以把word解压出来,在xml中对照着看,然后修改自己需要的属性即可,eg:

  2. 最后补充一个小建议,这种和业务耦合不是很高的技术需求,使用cursor会有奇效哦
相关推荐
大春儿的试验田38 分钟前
Parameter ‘XXX‘ not found. Available parameters are [list, param1]
java
程序员JerrySUN1 小时前
[特殊字符] 深入理解 Linux 内核进程管理:架构、核心函数与调度机制
java·linux·架构
2302_809798321 小时前
【JavaWeb】Docker项目部署
java·运维·后端·青少年编程·docker·容器
空中湖1 小时前
文档极速转换器 - 免费批量Word转PDF工具
pdf·word
网安INF2 小时前
CVE-2020-17519源码分析与漏洞复现(Flink 任意文件读取)
java·web安全·网络安全·flink·漏洞
一叶知秋哈2 小时前
Java应用Flink CDC监听MySQL数据变动内容输出到控制台
java·mysql·flink
沉到海底去吧Go2 小时前
【工具教程】PDF电子发票提取明细导出Excel表格,OFD电子发票行程单提取保存表格,具体操作流程
pdf·excel
jackson凌2 小时前
【Java学习笔记】SringBuffer类(重点)
java·笔记·学习
sclibingqing2 小时前
SpringBoot项目接口集中测试方法及实现
java·spring boot·后端
程序员JerrySUN2 小时前
全面理解 Linux 内核性能问题:分类、实战与调优策略
java·linux·运维·服务器·单片机