线程池导入大数据量excel

一、前置准备阶段:环境准备与参数配置

  1. 依赖引入pom.xml中添加 EasyExcel 和线程池相关依赖,确保版本兼容(easyexcel 建议 2.2.10+,避免避免池使用 Spring 自带的ThreadPoolTaskExecutor

  2. 线程池 参数定制化配置 针对 Excel 导入的 IO 密集型特性,配置线程池(核心线程数 = CPU 核心数 ×2,最大线程数 = CPU 核心数 ×4,队列容量 = 100),并通过@Configuration注入 Spring 容器

  3. 业务模型与 Excel 映射类定义创建与 Excel 列对应的实体类,通过 easyexcel 注解指定表头映射和数据转换规则(如日期格式化、字段校验)

二、文件上传与预处理

  1. 接收前端上传的文件 通过 SpringMVC 的MultipartFile接收 Excel 文件,保存到临时目录(如/tmp/excel-import/),并生成唯一任务 ID(用于后续进度查询)

  2. 文件合法性校验 校验文件格式(必须为.xlsx.xls)、大小(如不超过 100MB)、表头是否匹配(通过 easyexcel 的headRowNumber解析表头并对比预期字段)

三、任务拆分与分发

  1. 按文件 / Sheet 页拆分任务 主线程读取 Excel 的 Sheet 数量,为每个 Sheet 创建独立任务(若 Sheet 行数超过 5 万,进一步按 5 万行 / 片拆分),通过@Async注解提交到线程池

  2. 多任务并行调度 主线程收集所有子任务的CompletableFuture,通过CompletableFuture.allOf()等待所有任务完成,最终汇总结果

四、EasyExcel 流式解析与数据处理

  1. 自定义 ReadListener 处理解析逻辑 通过 easyexcel 的ReadListener逐行解析数据,实现 "读一行处理一行",避免内存堆积

  2. 启动 EasyExcel 解析任务 在子任务中调用 easyexcel 的read方法,传入自定义监听器和解析范围(startRow、endRow)

五、数据库批量写入优化

  1. 使用 MyBatis 批处理 减少 IO 在业务层开启ExecutorType.BATCH模式,累积 SQL 后一次性执行,降低数据库连接开销

  2. 控制并发写入 线程数通过 Redis 分布式锁限制同时写入数据库的线程数(如最多 5 个线程),避免数据库连接池耗尽

六、进度追踪与异常处理

  1. 实时更新任务进度在 Redis 中存储任务进度(总条数、成功数、失败数),前端通过任务 ID 轮询查询

  2. 错误数据收集与重试对解析或入库失败的行,记录行号和错误原因,导入完成后生成 "错误 Excel" 供用户下载修正

七、资源清理与任务归档

  1. 临时文件清理导入完成后(无论成功 / 失败),通过定时任务删除临时目录的 Excel 文件(保留 7 天备份)

  2. 任务结果归档将导入结果(总条数、成功数、错误信息)存入数据库归档,便于后续审计和问题追溯

相关推荐
啊哈哈哈哈啊有13 小时前
导出树形结构,excel
java·windows·excel
Dxy123931021617 小时前
Elasticsearch 聚合入门:像 Excel 透视表一样分析数据
elasticsearch·excel
一位代码17 小时前
Excel | .xls 与 .xlsx 文件的区别及使用 Excel 打开 CSV 文件出现乱码的解决办法
excel
CodeCraft Studio18 小时前
Excel处理控件Aspose.Cells教程:使用C#在Excel中创建树状图
前端·c#·excel·aspose·c# excel库·excel树状图·excel sdk
悟能不能悟20 小时前
vue导出excel文件
前端·vue.js·excel
CodeCraft Studio20 小时前
国产化Excel开发组件Spire.XLS教程:以Python编程方式在Excel中高亮重复值
开发语言·python·excel·spire.xls·excel自动化·excel高亮重复值·python处理excel
喝汽水的猫^1 天前
Java实现Excel 导出(多 Sheet、复杂格式)
java·excel
小费的部落1 天前
Excel 在Sheet3中 匹配Sheet1的A列和Sheet2的A列并处理空内容
java·前端·excel
缺点内向2 天前
如何在 C# 中重命名 Excel 工作表并设置标签颜色
开发语言·c#·excel
wtsolutions2 天前
Sheet-to-Doc: Automate Document Generation with Excel Data and Word Templates
word·excel·wtsolutions