【java批量导出pdf】优化方案

问题情境:

项目中存在web页面点击一键导出,导出所有数据对应的pdf文件,由于有些pdf文件是实时生成的,之前最简答的写法for循环处理速度太慢,超过了nginx配置的最大响应时间了,且对用户交互体验上很不友好,所以进一步进行优化。

解决方案:

1.对大量的数据进行分段处理;(向上取余)

代码示例:

复制代码
public List<List<FrApplyGuaranteeInfo>> segmentList(List<FrApplyGuaranteeInfo> list ,int segmentSize) {
        int limit = (list.size() + segmentSize - 1) / segmentSize;
        List<List<FrApplyGuaranteeInfo>> segmentList =
                Stream.iterate(0, n -> n + 1).limit(limit).parallel().map(a -> list.stream().
                        skip(a * segmentSize).limit(segmentSize).parallel().collect(Collectors.toList())).collect(Collectors.toList());
        return segmentList;
    }

2.通过threadPoolTaskExcetor.submit()方法进行多线程任务处理

示例代码:
第一步分段处理后的list

复制代码
lists.forEach({list->{
   threadPoolExecutor.submit(new xxxxTask());
})

第二步:具体的task需要实现callalbe

示例代码如下:

复制代码
@Slf4j
public class DownloadLetterZipTask implements Callable {
    
   // 需要预审的记录    
   private List<FrApplyGuaranteeInfo> dataList;
   private ZipOutputStream zipOutputStream;
   private CountDownLatch countDownLatch;
   private IFrApplyGuaranteeInfoService applyGuaranteeInfoService;
   public DownloadLetterZipTask(List<FrApplyGuaranteeInfo> dataList, ZipOutputStream zipOutputStream, CountDownLatch countDownLatch, IFrApplyGuaranteeInfoService applyGuaranteeInfoService)
   {    this.dataList = dataList;
       this.zipOutputStream = zipOutputStream;      
       this.countDownLatch = countDownLatch;      
       this.applyGuaranteeInfoService = applyGuaranteeInfoService;    }
    @Override
    public Object call() throws Exception {
       log.info("start--------------" + Thread.currentThread().getName());        
       try {           
           for (FrApplyGuaranteeInfo applyGuaranteeInfo : dataList) {
               if (!StringUtils.isEmpty(applyGuaranteeInfo.getAcceptNo())) {
                   try {
                       // 这一步为具体的将文件转为字节数组输出流
                       ByteArrayOutputStream waterOutputStream = applyGuaranteeInfoService.getLetterPdfByteStream(applyGuaranteeInfo.getAcceptNo());
                       byte[] xmpMetadata = waterOutputStream.toByteArray();
                       synchronized (zipOutputStream) {
                           zipOutputStream.putNextEntry(new ZipEntry(applyGuaranteeInfo.getGenerateeLetterNo() + ".pdf"));
                           zipOutputStream.write(xmpMetadata);
                           zipOutputStream.closeEntry();
                       }
                   } catch (Exception e) {
                       log.error("[一键导出]---acceptNo为{}生成pdf失败", applyGuaranteeInfo.getAcceptNo());
                   }
               }
           }
       } catch (Exception e) {
           e.printStackTrace();
           log.error("[xxxx]-批量下载zip失败");

       } finally {
           countDownLatch.countDown();
          }
       return null;
      }
   }
相关推荐
卡尔特斯9 小时前
Android Kotlin 项目代理配置【详细步骤(可选)】
android·java·kotlin
集成显卡9 小时前
windows 下使用 bat 批处理运行 Chrome 无头模式刷一波访问量
windows·程序员
白鲸开源9 小时前
Ubuntu 22 下 DolphinScheduler 3.x 伪集群部署实录
java·ubuntu·开源
ytadpole9 小时前
Java 25 新特性 更简洁、更高效、更现代
java·后端
纪莫9 小时前
A公司一面:类加载的过程是怎么样的? 双亲委派的优点和缺点? 产生fullGC的情况有哪些? spring的动态代理有哪些?区别是什么? 如何排查CPU使用率过高?
java·java面试⑧股
JavaGuide10 小时前
JDK 25(长期支持版) 发布,新特性解读!
java·后端
用户37215742613510 小时前
Java 轻松批量替换 Word 文档文字内容
java
白鲸开源10 小时前
教你数分钟内创建并运行一个 DolphinScheduler Workflow!
java
Java中文社群11 小时前
有点意思!Java8后最有用新特性排行榜!
java·后端·面试
代码匠心11 小时前
从零开始学Flink:数据源
java·大数据·后端·flink