多任务执行时,共享请求对象被并发修改

导出数据缺失问题分析

共享的请求对象被并发修改

baseRequest 是共享对象,多个线程同时修改其 page 属性会导致数据错乱:

源代码如下

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
										 int totalPages, ExcelWriter excelWriter,
										 WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;
			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					// 设置当前页
					baseRequest.setPage(currentPage);
					PageResponse<List<StudentResponse>> pageData = this.queryPage(baseRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

修改方案

方案1:为每个任务创建独立的请求对象(推荐)

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
								int totalPages, ExcelWriter excelWriter,
								WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;
			// 为每个任务创建独立的请求对象,拷贝属性
			StudentPageRequest pageRequest = createStudentPageRequest(baseRequest);
			pageRequest.setPage(currentPage);
			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					PageResponse<List<StudentResponse>> pageData = this.queryPage(pageRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

方案2:使用线程局部变量

java 复制代码
    /**
	 * 并发处理数据
	 */
	private void processBatches(StudentPageRequest baseRequest,
								int totalPages, ExcelWriter excelWriter,
								WriteSheet writeSheet) {
		if (totalPages <= 1) {
			return;
		}
		List<CompletableFuture<Void>> futures = new ArrayList<>();
		// 每页单独一个任务执行
		for (int pageNum = 1; pageNum <= totalPages; pageNum++) {
			final int currentPage = pageNum;

			// 多任务执行
			CompletableFuture<Void> future = CompletableFuture.runAsync(() -> {
				try {
					// 使用线程局部变量,拷贝属性
					StudentPageRequest pageRequest = createStudentPageRequest(baseRequest);
					pageRequest.setPage(currentPage);
					PageResponse<List<StudentResponse>> pageData = this.queryPage(pageRequest);
					// 并行处理并组装数据
					List<List<String>> rowData = parallelConvertToRowData(pageData.getData());
					synchronized (excelWriter) {
						excelWriter.write(rowData, writeSheet);
					}
					log.info("已完成 {}/{} 页,数据量:{}", currentPage, totalPages, pageData.getData().size());
				} catch (Exception e) {
					throw new AppRuntimeException(ResponseCode.EXPORT_FILE_FAILED, e);
				}
			}, importTaskExecutor);
			futures.add(future);
		}

		// 等待所有任务完成,30分钟超时
		CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
				.orTimeout(30, TimeUnit.MINUTES)
				.join();
	}

总结:

在多线程并发场景下,避免使用共享的对象,建议为每个人任务创建独立的对象。

相关推荐
山岚的运维笔记3 分钟前
SQL Server笔记 -- 第16章:MERGE
java·笔记·sql·microsoft·sqlserver
Andy Dennis9 分钟前
一文漫谈设计模式之创建型模式(一)
java·开发语言·设计模式
belldeep10 分钟前
Java:Tomcat 9 和 mermaid.min.js 10.9 上传.csv文件实现 Markdown 中 Mermaid 图表的渲染
java·tomcat·mermaid·去除flexmark
AutumnorLiuu17 分钟前
C++并发编程学习(二)—— 线程所有权和管控
java·c++·学习
Demon_Hao18 分钟前
JAVA缓存的使用RedisCache、LocalCache、复合缓存
java·开发语言·缓存
踏雪羽翼20 分钟前
android 解决混淆导致AGPBI: {“kind“:“error“,“text“:“Type a.a is defined multiple times
android·java·开发语言·混淆·混淆打包出现a.a
lang2015092821 分钟前
Tomcat Maven插件:部署与卸载的架构设计
java·tomcat·maven
serve the people40 分钟前
python环境搭建 (六) Makefile 简单使用方法
java·服务器·python
重生之后端学习43 分钟前
146. LRU 缓存
java·数据结构·算法·leetcode·职场和发展
萧曵 丶1 小时前
懒加载单例模式中DCL方式和原理解析
java·开发语言·单例模式·dcl