大数据量模糊查询优化(流去重,流分批,建树操作)

大数据量模糊查询优化(流去重,流分批,建树操作)


前言

有时候会进行大数据量查询后的建树操作,如果直接使用sql语句会大大延缓业务效率,因此需要优化,本文章介绍了使用java8流操作以及hutool树工具栏的建树操作。


一、java8 流是什么

流是支持各种方法的对象序列(一系列对象,列入:LIst对象)

二、本次优化涉及操作

1.流去重

代码如下(示例):

java 复制代码
(操作对象).distinct().collect(Collectors.toList());

2.流分批

代码如下(示例):

java 复制代码
		//一批500条
		int batchSize = 500;
		//赋值
		List<String> finalSysDistrictParentCodeStringList = sysDistrictParentCodeStringList;
		//对finalSysDistrictParentCodeStringList进行分批处理
		List<List<String>> batches = IntStream.range(0, (finalSysDistrictParentCodeStringList.size() + batchSize - 1) / batchSize)
				.mapToObj(i -> finalSysDistrictParentCodeStringList.subList(i * batchSize, Math.min(finalSysDistrictParentCodeStringList.size(), (i + 1) * batchSize)))
				.collect(Collectors.toList());

3.hutool树工具类建树

代码如下(示例):

java 复制代码
		TreeNodeConfig treeNodeConfig = new TreeNodeConfig();
		//设置id字段
		treeNodeConfig.setIdKey("code");
		//设置父级id字段
		treeNodeConfig.setParentIdKey("parentCode");
		List<Tree<String>> trees = TreeUtil.build(result, "0", treeNodeConfig, ((object, treeNode) -> {
			//对树节点进行id赋值
			treeNode.setId(object.getCode());//id
			//对树节点进行父级id赋值
			treeNode.setParentId(object.getParentCode());//父id
			//对树节点进行名称赋值
			treeNode.putExtra("name", object.getName());
			//对树节点进行层级赋值
			treeNode.putExtra("level", object.getLevels());
		}));
		log.info("建树后:{}",trees.size());

4.全部代码

代码如下(示例):

java 复制代码
		//实体类


import lombok.Data;
import lombok.EqualsAndHashCode;
import org.apache.commons.lang.StringUtils;
import org.apache.commons.lang.builder.ToStringBuilder;
import org.apache.commons.lang.builder.ToStringStyle;

import java.util.Map;
import java.util.Set;

/**
 * 全国区域Demo
 */
@Data
@ApiModel(value = "全国区域")
public class SysDistrictDemo extends BasePageQuery {

	/**
	 * 编码
	 */
	private String code;
	/**
	 * 名称
	 */
	private String name;
	/**
	 * 父级编号
	 */
	private String parentCode;
	/**
	 * 层级
	 */
	private Integer levels;

}
java 复制代码
//整体函数
	public R getTreeByLikeInfoDemo(SysDistrictDemo sysDistrictDemo) {
		QueryWrapper<SysDistrict> wrapper = new QueryWrapper<>();
		wrapper.like("name",sysDistrictDemo.getName());
		List<String> sysDistrictParentCodeStringList = "根据条件模糊查询";
		log.info("去重前:{}",sysDistrictParentCodeStringList.size());
		//至此 取得所有数据 去重
		List<SysDistrictTree> result = new ArrayList<>();
		sysDistrictParentCodeStringList = sysDistrictParentCodeStringList.stream().distinct().collect(Collectors.toList());

		log.info("去重后:{}",sysDistrictParentCodeStringList.size());
		int batchSize = 500;
		List<String> finalSysDistrictParentCodeStringList = sysDistrictParentCodeStringList;

		List<List<String>> batches = IntStream.range(0, (finalSysDistrictParentCodeStringList.size() + batchSize - 1) / batchSize)
				.mapToObj(i -> finalSysDistrictParentCodeStringList.subList(i * batchSize, Math.min(finalSysDistrictParentCodeStringList.size(), (i + 1) * batchSize)))
				.collect(Collectors.toList());
		batches.forEach(codes->{
			result = "使用sql中in的查询操作,例如:select a.id from a in #{codes}"
		});
		log.info("取值后:{}",result.size());
		TreeNodeConfig treeNodeConfig = new TreeNodeConfig();
		//设置id字段
		treeNodeConfig.setIdKey("code");
		//设置父级id字段
		treeNodeConfig.setParentIdKey("parentCode");
		List<Tree<String>> trees = TreeUtil.build(result, "0", treeNodeConfig, ((object, treeNode) -> {
			//对树节点进行id赋值
			treeNode.setId(object.getCode());//id
			//对树节点进行父级id赋值
			treeNode.setParentId(object.getParentCode());//父id
			//对树节点进行名称赋值
			treeNode.putExtra("name", object.getName());
			//对树节点进行层级赋值
			treeNode.putExtra("level", object.getLevels());
		}));
		log.info("建树后:{}",trees.size());
		return R.ok(trees);
	}

总结

自此完成了优化,本人是50s优化至7s,欢迎讨论,勿喷,怕怕

相关推荐
编程零零七9 分钟前
Python巩固训练——第一天练习题
开发语言·python·python基础·python学习·python练习题
我爱Jack20 分钟前
时间与空间复杂度详解:算法效率的度量衡
java·开发语言·算法
米饭「」22 分钟前
C++AVL树
java·开发语言·c++
Zonda要好好学习29 分钟前
Python入门Day4
java·网络·python
SimonKing43 分钟前
告别传统读写!RandomAccessFile让你的Java程序快人一步
java·后端·程序员
Little-Hu1 小时前
QML TextEdit组件
java·服务器·数据库
Edingbrugh.南空1 小时前
操作系统级TCP性能优化:高并发场景下的内核参数调优实践
网络协议·tcp/ip·性能优化
心愿许得无限大1 小时前
Qt 常用界面组件
开发语言·c++·qt
2401_858286111 小时前
OS15.【Linux】gdb调试器的简单使用
linux·运维·服务器·开发语言·gdb
牛马baby1 小时前
MATLAB下载安装教程(附安装包)2025最新版(MATLAB R2024b)
开发语言·matlab