Elasticsearch知识汇总之ElasticSearch监控方案

ElasticSearch 监控方案

8 .1 ElasticSearch 监控指标

监控指标为磐基生产项指标,以下'监控项名称''指标名称 '使用的公式'都已详细说明,图表如下:

|----------------------------|------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 监控项名称 | 指标英文名称 | 使用的公式 |
| elasticsearch集群健康状态 | Elastic_Cluster_Health | elasticsearch_cluster_health_status{job="job",instance=\~"instance",cluster="cluster",color="red"}==1 or (elasticsearch_cluster_health_status{job="job",instance=~"instance",cluster="cluster",color="green"}==1)+4 or (elasticsearch_cluster_health_status{job="job",instance=\~"instance",cluster="cluster",color="yellow"}==1)+22 | | elasticsearch集群健康节点数 | elasticsearch_cluster_health_number_of_nodes | elasticsearch_cluster_health_number_of_nodes{job="job",instance=~"instance",cluster="cluster"} |
| elasticsearch集群健康数据节点数 | elasticsearch_cluster_health_number_of_data_nodes | elasticsearch_cluster_health_number_of_data_nodes{job="job",instance=\~"instance",cluster="cluster"} | | elasticsearch的jvm内存使用 | elasticsearch_jvm_memory_used | elasticsearch_jvm_memory_used_bytes{area="heap"} / elasticsearch_jvm_memory_max_bytes{area="heap"} | | elasticsearch的CPU使用率 | elasticsearch_process_cpu_percent | elasticsearch_process_cpu_percent{} | | elasticsearch磁盘空间使用率 | elasticsearch_filesystem_data_used_percent | 100 \* (elasticsearch_filesystem_data_size_bytes - elasticsearch_filesystem_data_free_bytes) / elasticsearch_filesystem_data_size_bytes | | elasticsearch的负载 | elasticsearch_os_load | elasticsearch_os_load1{job="job",instance=~"instance",cluster="cluster",name=~"name"} elasticsearch_os_load5{job="job",instance=~"instance",cluster="cluster",name=~"name"} elasticsearch_os_load15{job="job",instance=~"instance",cluster="cluster",name=~"$name"} |
| elasticsearch集群未分配片分片状态 | elasticsearch_cluster_health_unassigned_shards | elasticsearch_cluster_health_unassigned_shards{} |
| elasticsearch集群阻塞的任务数 | elasticsearch_cluster_health_number_of_pending_tasks | elasticsearch_cluster_health_number_of_pending_tasks{} |
| elasticsearch线程池中被拒绝的线程数 | elasticsearch_thread_pool_rejected_count | rate(elasticsearch_thread_pool_rejected_count{type!="management"}[5m]) |
| elasticsearch打开文件描述符数 | elasticsearch_process_open_files_count | elasticsearch_process_open_files_count/elasticsearch_process_max_files_descriptors * 100 |
| elasticsearch线程池活跃的线程数 | elasticsearch_thread_pool_queue_count | elasticsearch_thread_pool_active_count{} |
| elasticsearch JVM GC 垃圾搜集数 | elasticsearch_jvm_gc_collection_seconds_count | irate(elasticsearch_jvm_gc_collection_seconds_count{}[5]) |
| elasticsearch线程池完成的线程数 | elasticsearch_thread_pool_completed_count | irate(elasticsearch_thread_pool_completed_count{}[5]) |

8.2 Prometheus 监控

我们可以通过prometheus来取得他的监控指标,如图:截取部分图指标展示:

8.3 Grafana 展示

通过grafana来对它的指标进行监控,如图所示:

相关推荐
从零开始学习人工智能19 分钟前
核函数:解锁支持向量机的强大能力
大数据·人工智能·机器学习
中间件XL3 小时前
搜索引擎2.0(based elasticsearch6.8)设计与实现细节(完整版)
大数据·elasticsearch·搜索引擎
茶本无香8 小时前
Jenkins:自动化流水线的基石,开启 DevOps 新时代
自动化·jenkins·devops
livemetee8 小时前
一个完整的日志收集方案:Elasticsearch + Logstash + Kibana+Filebeat (一)
大数据·elasticsearch·搜索引擎
.似水8 小时前
Jenkins 2.479.1安装和邮箱配置教程
运维·jenkins
Lalolander14 小时前
设备制造行业项目管理难点解析,如何有效解决?
大数据·制造·工程项目管理·四算一控·epc·装备制造项目管理
项目管理打工人14 小时前
高端装备制造企业如何选择适配的项目管理系统提升项目执行效率?附选型案例
大数据·人工智能·驱动开发·科技·硬件工程·团队开发·制造
武子康16 小时前
大数据-274 Spark MLib - 基础介绍 机器学习算法 剪枝 后剪枝 ID3 C4.5 CART
大数据·人工智能·算法·机器学习·语言模型·spark-ml·剪枝
L2ncE18 小时前
ES101系列07 | 分布式系统和分页
java·后端·elasticsearch
加百力19 小时前
戴尔AI服务器订单激增至121亿美元,但传统业务承压
大数据·服务器·人工智能