优化大量数据导出到Excel的内存消耗(二):如果数据超出Excel单表上限,则进行分表

优化前:优化大量数据导出到Excel的内存消耗_大文件异步导出 内存占用高-CSDN博客

写Excel文件报错:Invalid row number (1048576) outside allowable range (0..1048575)

写入Excel时遇到`IllegalArgumentException`,原因是超出允许的最大行数。文章提供了解决方案,即使用多个sheet并将数据分批写入以避免此问题。

数据导出优化:如果数据超出Excel单表上限,Excel单表最多可以存储1048576条数据(1024的平方,2的20次方),如果数据超出Excel单表上限,则进行分表。

java 复制代码
 public void writeExcel(OutputStream os, String sheetName, Map<String, String> header, List<Map<String, Object>> datas) {
        logger.info("导入数据到excel==========> 开始");
        long startTime = System.currentTimeMillis();  // 记录开始时间
        int rowAccessWindowSize = 100;  // 设置适当的行访问窗口大小
        SXSSFWorkbook wb = new SXSSFWorkbook(rowAccessWindowSize);
        wb.setCompressTempFiles(true);  // 启用临时文件压缩以提高性能

        int sheetIndex = 0; // 新增变量,用于追踪当前的sheet索引
        int maxRowsPerSheet = 1048576; // 单个sheet的最大行数

        int totalRecords = ObjectKit.isNotEmpty(datas) ? datas.size() : 0;  // 总共导出记录数
        logger.info("即将导出记录总数: " + totalRecords);

        Map<String, CellStyle> cellStyles = initStyles(wb); // 优化:样式创建移到循环外部
        while (!datas.isEmpty()) {
            String currentSheetName = sheetName + "_" + sheetIndex;
            Sheet sheet = wb.createSheet(currentSheetName);
            int rowNum = 0;
            Row row = sheet.createRow(rowNum);
//            Map<String, CellStyle> cellStyles = initStyles(wb);
            int cellNum = 0;

            // 写入表头
            for (Map.Entry<String, String> entry : header.entrySet()) {
                String fieldDesc = entry.getValue();
                Cell cell = row.createCell(cellNum);
                cell.setCellValue(fieldDesc);
                logger.info("导入数据到excel==========> 表头" + entry.getKey());
                cellNum++;
            }


            // 计算本次循环需要处理的数据量
            int recordsToProcess = Math.min(maxRowsPerSheet - 1, datas.size()); // 减去1是因为第一行是表头

            for (int i = 0; i < recordsToProcess; i++) {
                Map<String, Object> map = datas.remove(0); // 从列表头部移除已处理的数据
                rowNum++;
                row = sheet.createRow(rowNum);
                cellNum = 0;

                for (Map.Entry<String, String> entry : header.entrySet()) {
                    String fieldName = entry.getKey();
                    Object data = map.get(fieldName.toUpperCase());
                    String dataString = null == data ? "" : data.toString();

                    if (data instanceof BigDecimal) {
                        Cell cell = row.createCell(cellNum);
                        cell.setCellValue(((BigDecimal) data).toPlainString());
                        cell.setCellStyle(cellStyles.get("Number"));
                    } else {
                        if (data instanceof Date || data instanceof Timestamp) {
                            if (data.toString().contains(".")) {
                                dataString = null == data ? "" : data.toString().substring(0, data.toString().indexOf("."));
                            } else {
                                dataString = null == data ? "" : data.toString();
                            }
                        }
                        row.createCell(cellNum).setCellValue(null == data ? "" : dataString);
                    }
                    cellNum++;
                }

                // 当前已导出记录数及进度
                if(rowNum % 10000 == 0){
                    logger.info("当前sheet已导出记录数: " + rowNum + ", 进度: " + ((float) rowNum / recordsToProcess) * 100 + "%");
                }
            }

            sheetIndex++; // 切换到下一个sheet
        }

        logger.info("导入数据到excel==========> 结束");
        long endTime = System.currentTimeMillis();  // 记录结束时间
        long elapsedTime = endTime - startTime;  // 计算耗时时间
        logger.info("总共导出记录数: " + totalRecords);
        long elapsedTimeInSeconds = elapsedTime / 1000;  // 将毫秒转换为秒
        logger.info("耗时时间: " + elapsedTimeInSeconds + " 秒 " );


        try {
            wb.write(os);
        } catch (IOException e) {
            throw new ImpException(ImpError.APP_ERR_20_04_10, e);
        } finally {
            try {
                if (null != wb) {
                    wb.close();
                }
            } catch (IOException e) {
                logger.error(e.getMessage(), e);
            }
        }
    }

这一优化措施确保了当数据量超过Excel单表上限时,数据能够被有效地分散到多个工作表中,从而支持更大规模的数据导出。

目前测试了导出三百万数据正常则进行分表。

相关推荐
上山的月16 分钟前
MySQL -函数和约束
数据库·mysql
zhcf19 分钟前
【MySQL】十三,关于MySQL的全文索引
数据库·mysql
丁总学Java28 分钟前
要查询 `user` 表中 `we_chat_open_id` 列不为空的用户数量
数据库·mysql
抓哇能手28 分钟前
数据库系统概论
数据库·人工智能·sql·mysql·计算机
littlegirll29 分钟前
一个从oracle使用spool导出数据到kadb的脚本
数据库·oracle
geovindu31 分钟前
CSharp: Oracle Stored Procedure query table
数据库·oracle·c#·.net
油丶酸萝卜别吃44 分钟前
MyBatis中XML文件的模板
xml·数据库·mybatis
三天不学习1 小时前
【Select 语法全解密】.NET开源ORM框架 SqlSugar 系列
数据库·.net·orm·微软技术·sqlsugar
CC呢1 小时前
基于单片机的智能婴儿床监护系统多功能婴儿床摇篮系统
数据库·mongodb
林的快手2 小时前
209.长度最小的子数组
java·数据结构·数据库·python·算法·leetcode