多任务执行时,共享请求对象被并发修改

导出数据缺失问题分析

共享的请求对象被并发修改

baseRequest 是共享对象,多个线程同时修改其 page 属性会导致数据错乱:

源代码如下

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
										 int totalPages, ExcelWriter excelWriter,
										 WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;
			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					// 设置当前页
					baseRequest.setPage(currentPage);
					PageResponse<List<StudentResponse>> pageData = this.queryPage(baseRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

修改方案

方案1:为每个任务创建独立的请求对象(推荐)

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
								int totalPages, ExcelWriter excelWriter,
								WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;
			// 为每个任务创建独立的请求对象,拷贝属性
			StudentPageRequest pageRequest = createStudentPageRequest(baseRequest);
			pageRequest.setPage(currentPage);
			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					PageResponse<List<StudentResponse>> pageData = this.queryPage(pageRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

方案2:使用线程局部变量

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
								int totalPages, ExcelWriter excelWriter,
								WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;

			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					// 使用线程局部变量,拷贝属性
					StudentPageRequest pageRequest = createStudentPageRequest(baseRequest);
					pageRequest.setPage(currentPage);
					PageResponse<List<StudentResponse>> pageData = this.queryPage(pageRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

总结:

在多线程并发场景下,避免使用共享的对象,建议为每个人任务创建独立的对象。

相关推荐
人道领域7 分钟前
SSM框架从入门到入土(AOP面向切面编程)
java·开发语言
大模型玩家七七27 分钟前
梯度累积真的省显存吗?它换走的是什么成本
java·javascript·数据库·人工智能·深度学习
CodeToGym1 小时前
【Java 办公自动化】Apache POI 入门:手把手教你实现 Excel 导入与导出
java·apache·excel
凡人叶枫1 小时前
C++中智能指针详解(Linux实战版)| 彻底解决内存泄漏,新手也能吃透
java·linux·c语言·开发语言·c++·嵌入式开发
JMchen1231 小时前
Android后台服务与网络保活:WorkManager的实战应用
android·java·网络·kotlin·php·android-studio
阔皮大师2 小时前
INote轻量文本编辑器
java·javascript·python·c#
小法师爱分享2 小时前
StickyNotes,简单便签超实用
java·python
qq_297574672 小时前
Linux 服务器 Java 开发环境搭建保姆级教程
java·linux·服务器
金牌归来发现妻女流落街头2 小时前
【从SpringBoot到SpringCloud】
java·spring boot·spring cloud
毅炼2 小时前
Java 基础常见问题总结(4)
java·后端