ES实战-聚集

根据某字段值聚集返回统计数据

bash 复制代码
#curl 写法
curl 'localhost:9200/get-together/_search?pretty' -H 'Content-Type:application/json' -d '{
"aggs":{
	"top_tags":{
	"terms":{
		"field":"tags.verbatim"
		}
	}
}}'
# kibana主体写法
GET /get-together/_search
{
  "aggs": {
    "top_tags": {
      "terms": {
        "field": "tags.verbatim"
      }
    }
  }
}

Elasticsearch提供了多种聚合类型,用于不同的分析目的

1.terms聚合-适用于统计字段值的分布情况

2.avg:计算平均值。

3.sum:计算总和。

4.min和max:找到最小值和最大值。

5.histogram:按照数值区间分桶。

6.date_histogram:按照时间间隔分桶。

7.range:基于预定义的范围分桶。

8.cardinality:计算字段的基数(不同值的数量)。

等等。
在指定查询条件情况下聚合

bash 复制代码
GET /get-together/_search
{
  "query": {
    "match": {
      "name":"Denver"
    }
  }, 
  "aggs": {
    "top_tags": {
      "terms": {
        "field": "tags.verbatim"
      }
    }
  }
}

聚合某个数组类型的字段

bash 复制代码
#其中的stats 还可以换成avg min max sum value_count
GET /get-together/_search?pretty
{
  "size": 0,
  "aggs": {
    "attendees_stats": {
      "stats": {
        "script": {
          "source": "doc['attendees'].size()"
        }
      }
    }
  }
}
#使用extended_stats 聚合获取平方,方差,标准差
GET /get-together/_search?pretty
{
  "size": 0,
  "aggs": {
    "attendees_stats": {
      "extended_stats": {
        "script": {
          "source": "doc['attendees'].size()"
        }
      }
    }
  }
}

Percentiles 聚合

bash 复制代码
#percentiles聚合用于计算一个字段的百分位数,可以帮助你了解数据的分布。
GET /_search
{
  "aggs": {
    "grade_percentiles": {
      "percentiles": {
        "field": "grade",
        "percents": [25, 50, 75]  // 可以指定需要的百分位数
      }
    }
  }
}

Percentile Ranks 聚合

bash 复制代码
#percentile_ranks聚合显示了值在数据分布中的排名百分位。
GET /_search
{
  "aggs": {
    "grade_percentile_ranks": {
      "percentile_ranks": {
        "field": "grade",
        "values": [60, 70, 80]  // 你想知道这些值的百分位排名
      }
    }
  }
}

Cardinality 聚合

bash 复制代码
#cardinality聚合用于计算字段中不同值的数量,类似于SQL中的COUNT(DISTINCT field)。
GET /_search
{
  "aggs": {
    "unique_grades": {
      "cardinality": {
        "field": "grade"
      }
    }
  }
}
相关推荐
刘某的Cloud1 小时前
列表、元组、字典、集合-组合数据类型
linux·开发语言·python
学烹饪的小胡桃1 小时前
【运维学习】实时性能监控工具 WGCLOUD v3.6.2 更新介绍
linux·运维·服务器·学习·工单系统
知识分享小能手1 小时前
Ubuntu入门学习教程,从入门到精通,Ubuntu 22.04的桌面环境 (4)
linux·学习·ubuntu
Lueeee.1 小时前
图解字符驱动模块设计思路
linux
白露与泡影2 小时前
使用systemd,把服务装进 Linux 心脏里~
linux·运维·python
CQ_YM2 小时前
Linux管道通信
linux·c语言·管道·ipc·管道通信
Elasticsearch3 小时前
通过将 OpenTelemetry Collector 用作框架,释放其强大功能
elasticsearch
k***92163 小时前
【Linux】进程概念(五):详解环境变量的本质
linux·运维·服务器
世转神风-4 小时前
VMware-挂载报错:no mountpoint specified
linux
KakiNakajima4 小时前
CentOS 7 x86系统安装EMQX 【kaki备忘录】
linux·运维·centos