【java批量导出pdf】优化方案

问题情境:

项目中存在web页面点击一键导出,导出所有数据对应的pdf文件,由于有些pdf文件是实时生成的,之前最简答的写法for循环处理速度太慢,超过了nginx配置的最大响应时间了,且对用户交互体验上很不友好,所以进一步进行优化。

解决方案:

1.对大量的数据进行分段处理;(向上取余)

代码示例:

复制代码
public List<List<FrApplyGuaranteeInfo>> segmentList(List<FrApplyGuaranteeInfo> list ,int segmentSize) {
        int limit = (list.size() + segmentSize - 1) / segmentSize;
        List<List<FrApplyGuaranteeInfo>> segmentList =
                Stream.iterate(0, n -> n + 1).limit(limit).parallel().map(a -> list.stream().
                        skip(a * segmentSize).limit(segmentSize).parallel().collect(Collectors.toList())).collect(Collectors.toList());
        return segmentList;
    }

2.通过threadPoolTaskExcetor.submit()方法进行多线程任务处理

示例代码:
第一步分段处理后的list

复制代码
lists.forEach({list->{
   threadPoolExecutor.submit(new xxxxTask());
})

第二步:具体的task需要实现callalbe

示例代码如下:

复制代码
@Slf4j
public class DownloadLetterZipTask implements Callable {
    
   // 需要预审的记录    
   private List<FrApplyGuaranteeInfo> dataList;
   private ZipOutputStream zipOutputStream;
   private CountDownLatch countDownLatch;
   private IFrApplyGuaranteeInfoService applyGuaranteeInfoService;
   public DownloadLetterZipTask(List<FrApplyGuaranteeInfo> dataList, ZipOutputStream zipOutputStream, CountDownLatch countDownLatch, IFrApplyGuaranteeInfoService applyGuaranteeInfoService)
   {    this.dataList = dataList;
       this.zipOutputStream = zipOutputStream;      
       this.countDownLatch = countDownLatch;      
       this.applyGuaranteeInfoService = applyGuaranteeInfoService;    }
    @Override
    public Object call() throws Exception {
       log.info("start--------------" + Thread.currentThread().getName());        
       try {           
           for (FrApplyGuaranteeInfo applyGuaranteeInfo : dataList) {
               if (!StringUtils.isEmpty(applyGuaranteeInfo.getAcceptNo())) {
                   try {
                       // 这一步为具体的将文件转为字节数组输出流
                       ByteArrayOutputStream waterOutputStream = applyGuaranteeInfoService.getLetterPdfByteStream(applyGuaranteeInfo.getAcceptNo());
                       byte[] xmpMetadata = waterOutputStream.toByteArray();
                       synchronized (zipOutputStream) {
                           zipOutputStream.putNextEntry(new ZipEntry(applyGuaranteeInfo.getGenerateeLetterNo() + ".pdf"));
                           zipOutputStream.write(xmpMetadata);
                           zipOutputStream.closeEntry();
                       }
                   } catch (Exception e) {
                       log.error("[一键导出]---acceptNo为{}生成pdf失败", applyGuaranteeInfo.getAcceptNo());
                   }
               }
           }
       } catch (Exception e) {
           e.printStackTrace();
           log.error("[xxxx]-批量下载zip失败");

       } finally {
           countDownLatch.countDown();
          }
       return null;
      }
   }
相关推荐
子豪-中国机器人12 分钟前
《C++ STL 基础入门》教案
java·开发语言
java_t_t16 分钟前
集合工具类
java·集合
消失的旧时光-194321 分钟前
ScheduledExecutorService
android·java·开发语言
勇闯逆流河22 分钟前
【C++】用红黑树封装map与set
java·开发语言·数据结构·c++
weixin_4024863428 分钟前
直接将ppt导出成pdf 图片失真严重,选中整个图片和需要的对象后保存成图片,格式选择为.svg
pdf
TextIn智能文档云平台30 分钟前
LLM 文档处理:如何让 AI 更好地理解中文 PDF 中的复杂格式?
人工智能·pdf
liliangcsdn31 分钟前
使用Deepseek解析PDF文件
pdf
Red Car31 分钟前
如何向文件夹内所有PDF增加水印
python·pdf
SpiderPex44 分钟前
论MyBatis和JPA权威性
java·mybatis
小猪咪piggy1 小时前
【微服务】(1) Spring Cloud 概述
java·spring cloud·微服务