Java 使用ListUtils对List分页处理

背景分析

工作中,经常遇到需要用Java进行分页处理数据,例如把1000万条Excel数据写入MySQL数据库,如果把这1000w数据一股脑的丢给MySQL,保证把数据库玩完,故需要批量写入,如每批次写入500条。这时候就可以使用ListUtils.partition了。

maven坐标

commons-collections4和Guava两个jar包的坐标如下:

java 复制代码
<dependency>
	<groupId>org.apache.commons</groupId>
	<artifactId>commons-collections4</artifactId>
	<version>4.4</version>
</dependency>
<dependency>
	<groupId>com.google.guava</groupId>
	<artifactId>guava</artifactId>
	<version>31.0.1-jre</version>
</dependency>

批处理List

基于commons-collections4和Guava两个jar包,对java.util.List中海量数据进行分批处理的逻辑如下所示,请求参数都是传入List和每页处理的数据量:

java 复制代码
    public static void main(String[] args) {
        List<String> list =new ArrayList<>();
        list.add("a");
        list.add("b");
        list.add("c");
        list.add("d");
        list.add("Wiener");
        batchDealData(list, 3);
        batchDealByGuava(list, 3);
    }

    private static void batchDealData (List data, int batchNum) {

        // commons-collections4
        List<List<String>> partitions = ListUtils.partition(data, batchNum);
        partitions.stream().forEach(sublist -> {
            System.out.println(sublist);
        });
    }
    private static void batchDealByGuava (List data, int batchNum) {
        // guava
        List<List<String>> partitions = Lists.partition(data, batchNum);
        partitions.stream().forEach(sublist -> {
            System.out.println(sublist);
        });
    }

这种处理方法相对于手动分页,其优点显而易见,既可以降低代码复杂度,又可以提高开发效率。小编在《Java 使用线程池分批插入或者更新数据》中,介绍了一种通用分页方式,略显复杂,下面基于commons-collections4,优化其中的分页策略,代码如下:

java 复制代码
private void batchDeal(List<Object> data, int batchNum) throws InterruptedException {
        if (CollectionUtils.isEmpty(data)) {
            return;
        }
        // 使用 ListUtils.partition分页
        List<List<Object>> newList = ListUtils.partition(data, batchNum);
        // 计算总页数
        int pageNum = newList.size(); 
        ExecutorService executor = Executors.newFixedThreadPool(pageNum);
        try {
            CountDownLatch countDownLatch = new CountDownLatch(pageNum);
            for (int i = 0; i < pageNum; i++) {
                ImportTask task = new ImportTask(newList.get(i), countDownLatch);
                executor.execute(task);
            }
            countDownLatch.await();
            log.info("数据操作完成!可以在此开始其它业务");
        } finally {
            // 关闭线程池,释放资源
            executor.shutdown();
        }
    }
    // 无改动
    class ImportTask implements Runnable {
        private List list;
        private CountDownLatch countDownLatch;

        public ImportTask(List data, CountDownLatch countDownLatch) {
            this.list = data;
            this.countDownLatch = countDownLatch;
        }

        @Override
        public void run() {
            if (null != list) {
                // 业务逻辑,例如批量insert或者update
                log.info("现在操作的数据是{}", list);
            }
            // 发出线程任务完成的信号
            countDownLatch.countDown();
        }
    }

整理自:https://www.cnblogs.com/east7/p/15876727.html

相关推荐
山峰哥1 天前
Python爬虫实战:从零构建高效数据采集系统
开发语言·数据库·爬虫·python·性能优化·架构
郝学胜-神的一滴1 天前
使用OpenGL绘制卡通效果的圣诞树
开发语言·c++·程序人生·游戏·图形渲染
想不明白的过度思考者1 天前
Spring Boot 配置文件深度解析
java·spring boot·后端
第二只羽毛1 天前
Java图书管理系统的设计与实现
java·大数据·安全·系统安全
想回家的一天1 天前
ECONNREFUSED ::1:8000 前端代理问题
开发语言
cike_y1 天前
Mybatis之解析配置优化
java·开发语言·tomcat·mybatis·安全开发
Jay_Franklin1 天前
SRIM通过python计算dap
开发语言·python
是一个Bug1 天前
Java基础50道经典面试题(四)
java·windows·python
Slow菜鸟1 天前
Java基础架构设计(三)| 通用响应与异常处理(分布式应用通用方案)
java·开发语言
消失的旧时光-19431 天前
401 自动刷新 Token 的完整架构设计(Dio 实战版)
开发语言·前端·javascript