ES实战-聚集

根据某字段值聚集返回统计数据

bash 复制代码
#curl 写法
curl 'localhost:9200/get-together/_search?pretty' -H 'Content-Type:application/json' -d '{
"aggs":{
	"top_tags":{
	"terms":{
		"field":"tags.verbatim"
		}
	}
}}'
# kibana主体写法
GET /get-together/_search
{
  "aggs": {
    "top_tags": {
      "terms": {
        "field": "tags.verbatim"
      }
    }
  }
}

Elasticsearch提供了多种聚合类型,用于不同的分析目的

1.terms聚合-适用于统计字段值的分布情况

2.avg:计算平均值。

3.sum:计算总和。

4.min和max:找到最小值和最大值。

5.histogram:按照数值区间分桶。

6.date_histogram:按照时间间隔分桶。

7.range:基于预定义的范围分桶。

8.cardinality:计算字段的基数(不同值的数量)。

等等。
在指定查询条件情况下聚合

bash 复制代码
GET /get-together/_search
{
  "query": {
    "match": {
      "name":"Denver"
    }
  }, 
  "aggs": {
    "top_tags": {
      "terms": {
        "field": "tags.verbatim"
      }
    }
  }
}

聚合某个数组类型的字段

bash 复制代码
#其中的stats 还可以换成avg min max sum value_count
GET /get-together/_search?pretty
{
  "size": 0,
  "aggs": {
    "attendees_stats": {
      "stats": {
        "script": {
          "source": "doc['attendees'].size()"
        }
      }
    }
  }
}
#使用extended_stats 聚合获取平方,方差,标准差
GET /get-together/_search?pretty
{
  "size": 0,
  "aggs": {
    "attendees_stats": {
      "extended_stats": {
        "script": {
          "source": "doc['attendees'].size()"
        }
      }
    }
  }
}

Percentiles 聚合

bash 复制代码
#percentiles聚合用于计算一个字段的百分位数,可以帮助你了解数据的分布。
GET /_search
{
  "aggs": {
    "grade_percentiles": {
      "percentiles": {
        "field": "grade",
        "percents": [25, 50, 75]  // 可以指定需要的百分位数
      }
    }
  }
}

Percentile Ranks 聚合

bash 复制代码
#percentile_ranks聚合显示了值在数据分布中的排名百分位。
GET /_search
{
  "aggs": {
    "grade_percentile_ranks": {
      "percentile_ranks": {
        "field": "grade",
        "values": [60, 70, 80]  // 你想知道这些值的百分位排名
      }
    }
  }
}

Cardinality 聚合

bash 复制代码
#cardinality聚合用于计算字段中不同值的数量,类似于SQL中的COUNT(DISTINCT field)。
GET /_search
{
  "aggs": {
    "unique_grades": {
      "cardinality": {
        "field": "grade"
      }
    }
  }
}
相关推荐
楠奕1 分钟前
CentOS7安装GoldenDB单机搭建及常见报错解决方案
linux·运维·服务器
剑锋所指,所向披靡!32 分钟前
Linux常用指令(2)
linux·运维·服务器
不愿透露姓名的大鹏1 小时前
Oracle归档日志爆满急救指南
linux·数据库·oracle·dba
W.W.H.1 小时前
嵌入式常见的面试题1
linux·网络·经验分享·网络协议·tcp/ip
木白CPP1 小时前
DMA-Buffer内核驱动API文档
linux
HXQ_晴天1 小时前
Linux 系统的交互式进程监控工具htop
linux·服务器·网络
song8582 小时前
韦东山开发手册阅读笔记(五)
linux
LIZhang20162 小时前
linux写一个脚本实时保存内存占用情况
linux·运维·服务器
IDC02-阿杰2 小时前
Windows WSL2安装Ubuntu24.04全攻略
linux·windows
s09071362 小时前
ZYNQ7000 AXI DMA 接收中断(S2MM_introut)全解析:从硬件原理到Linux驱动开发
linux·驱动开发·dma·zynq