大数据量模糊查询优化(流去重,流分批,建树操作)

大数据量模糊查询优化(流去重,流分批,建树操作)


前言

有时候会进行大数据量查询后的建树操作,如果直接使用sql语句会大大延缓业务效率,因此需要优化,本文章介绍了使用java8流操作以及hutool树工具栏的建树操作。


一、java8 流是什么

流是支持各种方法的对象序列(一系列对象,列入:LIst对象)

二、本次优化涉及操作

1.流去重

代码如下(示例):

java 复制代码
(操作对象).distinct().collect(Collectors.toList());

2.流分批

代码如下(示例):

java 复制代码
		//一批500条
		int batchSize = 500;
		//赋值
		List<String> finalSysDistrictParentCodeStringList = sysDistrictParentCodeStringList;
		//对finalSysDistrictParentCodeStringList进行分批处理
		List<List<String>> batches = IntStream.range(0, (finalSysDistrictParentCodeStringList.size() + batchSize - 1) / batchSize)
				.mapToObj(i -> finalSysDistrictParentCodeStringList.subList(i * batchSize, Math.min(finalSysDistrictParentCodeStringList.size(), (i + 1) * batchSize)))
				.collect(Collectors.toList());

3.hutool树工具类建树

代码如下(示例):

java 复制代码
		TreeNodeConfig treeNodeConfig = new TreeNodeConfig();
		//设置id字段
		treeNodeConfig.setIdKey("code");
		//设置父级id字段
		treeNodeConfig.setParentIdKey("parentCode");
		List<Tree<String>> trees = TreeUtil.build(result, "0", treeNodeConfig, ((object, treeNode) -> {
			//对树节点进行id赋值
			treeNode.setId(object.getCode());//id
			//对树节点进行父级id赋值
			treeNode.setParentId(object.getParentCode());//父id
			//对树节点进行名称赋值
			treeNode.putExtra("name", object.getName());
			//对树节点进行层级赋值
			treeNode.putExtra("level", object.getLevels());
		}));
		log.info("建树后:{}",trees.size());

4.全部代码

代码如下(示例):

java 复制代码
		//实体类


import lombok.Data;
import lombok.EqualsAndHashCode;
import org.apache.commons.lang.StringUtils;
import org.apache.commons.lang.builder.ToStringBuilder;
import org.apache.commons.lang.builder.ToStringStyle;

import java.util.Map;
import java.util.Set;

/**
 * 全国区域Demo
 */
@Data
@ApiModel(value = "全国区域")
public class SysDistrictDemo extends BasePageQuery {

	/**
	 * 编码
	 */
	private String code;
	/**
	 * 名称
	 */
	private String name;
	/**
	 * 父级编号
	 */
	private String parentCode;
	/**
	 * 层级
	 */
	private Integer levels;

}
java 复制代码
//整体函数
	public R getTreeByLikeInfoDemo(SysDistrictDemo sysDistrictDemo) {
		QueryWrapper<SysDistrict> wrapper = new QueryWrapper<>();
		wrapper.like("name",sysDistrictDemo.getName());
		List<String> sysDistrictParentCodeStringList = "根据条件模糊查询";
		log.info("去重前:{}",sysDistrictParentCodeStringList.size());
		//至此 取得所有数据 去重
		List<SysDistrictTree> result = new ArrayList<>();
		sysDistrictParentCodeStringList = sysDistrictParentCodeStringList.stream().distinct().collect(Collectors.toList());

		log.info("去重后:{}",sysDistrictParentCodeStringList.size());
		int batchSize = 500;
		List<String> finalSysDistrictParentCodeStringList = sysDistrictParentCodeStringList;

		List<List<String>> batches = IntStream.range(0, (finalSysDistrictParentCodeStringList.size() + batchSize - 1) / batchSize)
				.mapToObj(i -> finalSysDistrictParentCodeStringList.subList(i * batchSize, Math.min(finalSysDistrictParentCodeStringList.size(), (i + 1) * batchSize)))
				.collect(Collectors.toList());
		batches.forEach(codes->{
			result = "使用sql中in的查询操作,例如:select a.id from a in #{codes}"
		});
		log.info("取值后:{}",result.size());
		TreeNodeConfig treeNodeConfig = new TreeNodeConfig();
		//设置id字段
		treeNodeConfig.setIdKey("code");
		//设置父级id字段
		treeNodeConfig.setParentIdKey("parentCode");
		List<Tree<String>> trees = TreeUtil.build(result, "0", treeNodeConfig, ((object, treeNode) -> {
			//对树节点进行id赋值
			treeNode.setId(object.getCode());//id
			//对树节点进行父级id赋值
			treeNode.setParentId(object.getParentCode());//父id
			//对树节点进行名称赋值
			treeNode.putExtra("name", object.getName());
			//对树节点进行层级赋值
			treeNode.putExtra("level", object.getLevels());
		}));
		log.info("建树后:{}",trees.size());
		return R.ok(trees);
	}

总结

自此完成了优化,本人是50s优化至7s,欢迎讨论,勿喷,怕怕

相关推荐
养乐多07229 分钟前
【Java】IO流
java
俊男无期9 分钟前
超效率工作法
java·前端·数据库
wuguan_12 分钟前
C#:多态函数重载、态符号重载、抽象、虚方法
开发语言·c#
小信啊啊12 分钟前
Go语言数组与切片的区别
开发语言·后端·golang
中国胖子风清扬14 分钟前
SpringAI和 Langchain4j等 AI 框架之间的差异和开发经验
java·数据库·人工智能·spring boot·spring cloud·ai·langchain
计算机学姐25 分钟前
基于php的摄影网站系统
开发语言·vue.js·后端·mysql·php·phpstorm
月明长歌25 分钟前
【码道初阶】牛客TSINGK110:二叉树遍历(较难)如何根据“扩展先序遍历”构建二叉树?
java·数据结构·算法
全栈陈序员32 分钟前
【Python】基础语法入门(二十)——项目实战:从零构建命令行 To-Do List 应用
开发语言·人工智能·python·学习
我不是程序猿儿37 分钟前
【C#】ScottPlot的Refresh()
开发语言·c#