poi-tl+kkviewfile实现生成pdf业务报告

需求背景,需要把ai生成的一些业务数据,生成一份pdf报告

需求分析

简单来说,就是json生成pdf的方案。

  1. 直接生成pdf。适合一些pdf样式简单的场景,一般就是纯文本按序渲染,或者是纯表格。如果需要一些复杂的排布,比如图片、水印、页眉页脚之类的,用pdf直接渲染的话就会复杂很多,而且后续有个什么改动,都很麻烦。我试了一下初步排除了这个方案。
  2. 先生成word,之后再word转pdf。先说缺点,word转pdf需要引入额外的服务,会比较重。但事情都是一体两面的,是缺点的同时也是优点,json生成word的技术,和word转pdf的技术都是比较成熟的,效果也不错,市面上都有很优秀的开源包或者开源系统可以使用。属于一种一劳永逸的方案吧。

方案选择

最后的方案是

  1. json生成word,采用poi-tl,一款简单好用的word模板渲染工具。大部分的样式都可以在word上提前用占位符的方式写好,代码层面只需要做数据填充即可,不用在后端代码里做样式渲染这种事情。(当然,部分场景也避免不了,不可能完全解耦)。基础用法不做赘述,官方文档很详细。后面会补一些我自己遇到的小问题。
  2. 第二步,word转pdf。这一步试了几种方案。aspose 收费且有水印,排除;jacob 不支持linux,排除;jodconverter+openOffice 效果不错且免费,但是openoffice不适合与业务服务部署在一起,单独部署的话需要再包一层,成本会略大。但好在这个事情有人已经做过了,kkviewfile就是市面上基于openoffice而开源的一个pdf预览转换服务。github上也有详细的部署文档,不做赘述。

使用过程中的几个小问题

  1. poi-tl种的区块对是一个很好用的原生插件,但是如果想在区块对中嵌套一些其他样式,比如列表的话,直接使用不会生效,需要额外指定。
java 复制代码
// 比如这里的events是一个事件列表占位符名称,NumberingRenderPolicyEva是我自定义的一个列表插件
builder.bind("events", new NumberingRenderPolicyEva()).build();
  1. word转pdf的时候,有些样式会有偏差,首先是因为word和pdf的格式不会是完全兼容的,一些隐藏的属性,在word中的展示和pdf中完全不一样。大部分属性都是可以在word中设置或者poi中指定的(poi会暴露常见的属性),比如我遇到的一个问题:word中设置好指定的行距,到了pdf中会失效,变成固定的行距,明显宽了很多,导致页数增加。
    试了几个样式,发现只有页眉没问题,所以确定是预设样式的属性原因。

    最后发现是这个属性的问题
    当然,还有一些隐藏更深的属性,可以把word解压出来,在xml中对照着看,然后修改自己需要的属性即可,eg:

  2. 最后补充一个小建议,这种和业务耦合不是很高的技术需求,使用cursor会有奇效哦
相关推荐
先做个垃圾出来………3 分钟前
差分数组(Difference Array)
java·数据结构·算法
BillKu19 分钟前
Java核心概念详解:JVM、JRE、JDK、Java SE、Java EE (Jakarta EE)
java·jvm·jdk·java ee·jre·java se·jakarta ee
刘婉晴1 小时前
【Java】NIO 简单介绍
java·nio
TextIn智能文档云平台1 小时前
复杂PDF文档结构化提取全攻略——从OCR到大模型知识库构建
pdf·ocr
会飞的小菠菜1 小时前
PDF文件中的广告二维码图片该怎么批量删除
pdf·删除·二维码·批量
渣哥1 小时前
聊聊我和 ArrayList、LinkedList、Vector 的“一地鸡毛”
java
浮游本尊1 小时前
Java学习第20天 - 性能优化与监控
java
纪莫2 小时前
技术面:Java并发(线程同步、死锁、多线程编排)
java·java面试⑧股
衍余未了2 小时前
k8s 内置的containerd配置阿里云个人镜像地址及认证
java·阿里云·kubernetes
叽哥2 小时前
Kotlin学习第 4 课:Kotlin 函数:从基础定义到高阶应用
android·java·kotlin