ES-针对某个字段去重后-获取某个字段值的所有值

针对上面表的数据,现在想根据age分组,并获取每个分组后的name有哪些(去重后)。

复制代码
select age, GROUP_CONCAT(DISTINCT(name)) from testtable group by age ;

结果:

如果想要增加排序:

复制代码
SELECT 
    age, 
    GROUP_CONCAT(DISTINCT name) AS names,
    COUNT(DISTINCT name) AS name_count
FROM 
    testtable 
GROUP BY 
    age
ORDER BY 
    name_count DESC;

结果:

使用ES实现类似上面的SQL效果:

复制代码
SearchRequest searchRequest = new SearchRequest("indexName");
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder().size(0);
        BoolQueryBuilder boolQueryBuilder = new BoolQueryBuilder();
       
        //时间范围
         RangeQueryBuilder pubtimeBuilder = QueryBuilders.rangeQuery("pubtime").gte(stime).lte(etime);
            boolQueryBuilder.must(pubtimeBuilder);
     
        searchSourceBuilder.query(boolQueryBuilder);

        // 添加 cardinality 聚合 
           AggregationBuilder  cardinalityAggregationBuilder = AggregationBuilders
                    .cardinality("unique_organ_id")
                    .field("organ_id");

              // 添加 terms 聚合以获取去重后的具体数据
           AggregationBuilder  termsAggregationBuilder = AggregationBuilders
                    .terms("distinct_ids")
                    .field("organ_id")
                    .size(10000);//根据实际的确定

        searchSourceBuilder.aggregation(cardinalityAggregationBuilder);
        searchSourceBuilder.aggregation(termsAggregationBuilder);
        searchRequest.source(searchSourceBuilder);

        try {
            SearchResponse searchResponse = elasticsearchClient.search(searchRequest, RequestOptions.DEFAULT);
            ParsedCardinality uniqueMcnOrganIdAgg = searchResponse.getAggregations().get("unique_organ_id");
            total = uniqueMcnOrganIdAgg.getValue();
            if(total > 0){
                Terms terms = searchResponse.getAggregations().get("distinct_ids");
                for (Terms.Bucket bucket : terms.getBuckets()) {
                    String mcnOrganId = bucket.getKeyAsString();
                    ids.add(mcnOrganId);
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        Result result = new Result();
        result.setIds(ids);
        result.setTotal(total);
        return result;
相关推荐
Coder_Boy_1 小时前
技术让开发更轻松的底层矛盾
java·大数据·数据库·人工智能·深度学习
helloworldandy1 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
数据知道3 小时前
PostgreSQL 故障排查:如何找出数据库中最耗时的 SQL 语句
数据库·sql·postgresql
qq_12498707533 小时前
基于SSM的动物保护系统的设计与实现(源码+论文+部署+安装)
java·数据库·spring boot·毕业设计·ssm·计算机毕业设计
枷锁—sha3 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
Coder_Boy_3 小时前
基于SpringAI的在线考试系统-考试系统开发流程案例
java·数据库·人工智能·spring boot·后端
Gain_chance3 小时前
35-学习笔记尚硅谷数仓搭建-DWS层最近n日汇总表及历史至今汇总表建表语句
数据库·数据仓库·hive·笔记·学习
此生只爱蛋4 小时前
【Redis】主从复制
数据库·redis
马猴烧酒.4 小时前
【面试八股|JAVA多线程】JAVA多线程常考面试题详解
java·服务器·数据库
天天爱吃肉82185 小时前
跟着创意天才周杰伦学新能源汽车研发测试!3年从工程师到领域专家的成长秘籍!
数据库·python·算法·分类·汽车