多任务执行时,共享请求对象被并发修改

导出数据缺失问题分析

共享的请求对象被并发修改

baseRequest 是共享对象,多个线程同时修改其 page 属性会导致数据错乱:

源代码如下

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
										 int totalPages, ExcelWriter excelWriter,
										 WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;
			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					// 设置当前页
					baseRequest.setPage(currentPage);
					PageResponse<List<StudentResponse>> pageData = this.queryPage(baseRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

修改方案

方案1:为每个任务创建独立的请求对象(推荐)

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
								int totalPages, ExcelWriter excelWriter,
								WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;
			// 为每个任务创建独立的请求对象,拷贝属性
			StudentPageRequest pageRequest = createStudentPageRequest(baseRequest);
			pageRequest.setPage(currentPage);
			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					PageResponse<List<StudentResponse>> pageData = this.queryPage(pageRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

方案2:使用线程局部变量

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
								int totalPages, ExcelWriter excelWriter,
								WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;

			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					// 使用线程局部变量,拷贝属性
					StudentPageRequest pageRequest = createStudentPageRequest(baseRequest);
					pageRequest.setPage(currentPage);
					PageResponse<List<StudentResponse>> pageData = this.queryPage(pageRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

总结:

在多线程并发场景下,避免使用共享的对象,建议为每个人任务创建独立的对象。

相关推荐
wand codemonkey1 小时前
SpringbootWeb【入门】+MySQL【安装】+【DataDrip安装 】+【连接MySQL】
java·mysql·mybatis
Mahir089 小时前
Spring 循环依赖深度解密:从问题本质到三级缓存源码级解析
java·后端·spring·缓存·面试·循环依赖·三级缓存
RyFit10 小时前
SpringAI 常见问题及解决方案大全
java·ai
石山代码10 小时前
C++ 内存分区 堆区
java·开发语言·c++
绝知此事10 小时前
【算法突围 01】线性结构与哈希表:后端开发的收纳术
java·数据结构·算法·面试·jdk·散列表
无风听海10 小时前
C# 隐式转换深度解析
java·开发语言·c#
一只大袋鼠11 小时前
Git 进阶(二):分支管理、暂存栈、远程仓库与多人协作
java·开发语言·git
德思特12 小时前
从 Dify 配置页理解 RAG 的重要参数
java·人工智能·llm·dify·rag
YOU OU12 小时前
Spring IoC&DI
java·数据库·spring
один but you13 小时前
从可变参数到 emplace:现代 C++ 性能优化的核心组合
java·开发语言