黑马聚合的分类及实现

1、什么是聚合?

聚合是对文档数据的统计、分析、计算

聚合的常见种类有哪些?

桶(Bucket)聚合:用来对文档做分组

TermAggregation:按照文档字段值分组

Date Histogram:按照日期阶梯分组,例如一周为一组,或者一月为一组

度量(Metric)聚合:用以计算一些值,比如:最大值、最小值、平均值等

AVg:求平均值

Max:求最大值

Min:求最小值

Stats:同时求max、min、avg、sum等

Pipeline:基于其它聚合结果再做聚合

参与聚合的字段类型必须是:

keyword

数值

日期

布尔

2、DSL实现Bucket聚合

可以新增在aggs内order字段以自定义排序规则,也可以在最外层新增query来限定聚合范围

aggs代表聚合,与query同级,此时query的作用是?

限定聚合的的文档范围

聚合必须的三要素:

聚合名称

聚合类型

聚合字段

聚合可配置属性有:

size:指定聚合结果数量

order:指定聚合结果排序方式

field:指定聚合字段

3、DSL实现Metrics聚合

在聚合类型同级多加一层聚合即可,如图

4、RestClient实现聚合

java 复制代码
@Test
    void testAggregation() throws IOException {
        //1、准备Request
        SearchRequest request = new SearchRequest("hotel");
        //2、准备dsl
        request.source().size(0);
        request.source().aggregation(AggregationBuilders
                .terms("brandAgg")
                .field("brand")
                .size(10)
        );
        //3、发出请求
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);
        //4、解析结果
        Aggregations aggregations = response.getAggregations();
        Terms brandTerms = aggregations.get("brandAgg");
        List<? extends Terms.Bucket> buckets = brandTerms.getBuckets();
        for (Terms.Bucket bucket : buckets) {
            String keyAsString = bucket.getKeyAsString();
            System.out.println(keyAsString);
        }
    }

封装请求信息逐层封装,解析相应结果逐层解析即可

注意返回值类型与方法传参,ctrl+p可以提示方法所需形参类型

多条件聚合只需增加aggregations,并在取出结果时逐一拆分即可

java 复制代码
    @Override
    public Map<String, List<String>> filters() {
        try {
            SearchRequest request = new SearchRequest("hotel");
            Map<String, List<String>> result = new HashMap<>();
            buildAggregation(request);
            SearchResponse response = client.search(request, RequestOptions.DEFAULT);
            Aggregations aggregations = response.getAggregations();
            List<String> brandlist = getAggByName(aggregations,"brandAgg");
            result.put("品牌",brandlist);
            result.put("星级",getAggByName(aggregations,"starNameAgg"));
            result.put("城市",getAggByName(aggregations,"cityAgg"));
            return result;
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

    private static List<String> getAggByName(Aggregations aggregations,String aggName) {
        Terms brandterms = aggregations.get(aggName);
        List<String> brandlist = new ArrayList<>();
        List<? extends Terms.Bucket> buckets = brandterms.getBuckets();
        for (Terms.Bucket bucket : buckets) {
            brandlist.add(bucket.getKeyAsString());
        }
        return brandlist;
    }

    private static void buildAggregation(SearchRequest request) {
        request.source().aggregation(AggregationBuilders
                .terms("brandAgg")
                .size(100)
                .field("brand"));
        request.source().aggregation(AggregationBuilders
                .terms("cityAgg")
                .size(100)
                .field("city"));
        request.source().aggregation(AggregationBuilders
                .terms("starNameAgg")
                .size(100)
                .field("starName"));
    }
相关推荐
曦月逸霜38 分钟前
第34次CCF-CSP认证真题解析(目标300分做法)
数据结构·c++·算法
海的诗篇_2 小时前
移除元素-JavaScript【算法学习day.04】
javascript·学习·算法
自动驾驶小卡2 小时前
A*算法实现原理以及实现步骤(C++)
算法
Unpredictable2222 小时前
【VINS-Mono算法深度解析:边缘化策略、初始化与关键技术】
c++·笔记·算法·ubuntu·计算机视觉
编程绿豆侠2 小时前
力扣HOT100之多维动态规划:1143. 最长公共子序列
算法·leetcode·动态规划
珂朵莉MM2 小时前
2021 RoboCom 世界机器人开发者大赛-高职组(初赛)解题报告 | 珂学家
java·开发语言·人工智能·算法·职场和发展·机器人
fail_to_code3 小时前
递归法的递归函数何时需要返回值
算法
C137的本贾尼3 小时前
(每日一道算法题)二叉树剪枝
算法·机器学习·剪枝
BUG收容所所长5 小时前
栈的奇妙世界:从冰棒到算法的华丽转身
前端·javascript·算法