Elasticsearch知识汇总之ElasticSearch监控方案

ElasticSearch 监控方案

8 .1 ElasticSearch 监控指标

监控指标为磐基生产项指标,以下'监控项名称''指标名称 '使用的公式'都已详细说明,图表如下:

|----------------------------|------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 监控项名称 | 指标英文名称 | 使用的公式 |
| elasticsearch集群健康状态 | Elastic_Cluster_Health | elasticsearch_cluster_health_status{job="job",instance=\~"instance",cluster="cluster",color="red"}==1 or (elasticsearch_cluster_health_status{job="job",instance=~"instance",cluster="cluster",color="green"}==1)+4 or (elasticsearch_cluster_health_status{job="job",instance=\~"instance",cluster="cluster",color="yellow"}==1)+22 | | elasticsearch集群健康节点数 | elasticsearch_cluster_health_number_of_nodes | elasticsearch_cluster_health_number_of_nodes{job="job",instance=~"instance",cluster="cluster"} |
| elasticsearch集群健康数据节点数 | elasticsearch_cluster_health_number_of_data_nodes | elasticsearch_cluster_health_number_of_data_nodes{job="job",instance=\~"instance",cluster="cluster"} | | elasticsearch的jvm内存使用 | elasticsearch_jvm_memory_used | elasticsearch_jvm_memory_used_bytes{area="heap"} / elasticsearch_jvm_memory_max_bytes{area="heap"} | | elasticsearch的CPU使用率 | elasticsearch_process_cpu_percent | elasticsearch_process_cpu_percent{} | | elasticsearch磁盘空间使用率 | elasticsearch_filesystem_data_used_percent | 100 \* (elasticsearch_filesystem_data_size_bytes - elasticsearch_filesystem_data_free_bytes) / elasticsearch_filesystem_data_size_bytes | | elasticsearch的负载 | elasticsearch_os_load | elasticsearch_os_load1{job="job",instance=~"instance",cluster="cluster",name=~"name"} elasticsearch_os_load5{job="job",instance=~"instance",cluster="cluster",name=~"name"} elasticsearch_os_load15{job="job",instance=~"instance",cluster="cluster",name=~"$name"} |
| elasticsearch集群未分配片分片状态 | elasticsearch_cluster_health_unassigned_shards | elasticsearch_cluster_health_unassigned_shards{} |
| elasticsearch集群阻塞的任务数 | elasticsearch_cluster_health_number_of_pending_tasks | elasticsearch_cluster_health_number_of_pending_tasks{} |
| elasticsearch线程池中被拒绝的线程数 | elasticsearch_thread_pool_rejected_count | rate(elasticsearch_thread_pool_rejected_count{type!="management"}[5m]) |
| elasticsearch打开文件描述符数 | elasticsearch_process_open_files_count | elasticsearch_process_open_files_count/elasticsearch_process_max_files_descriptors * 100 |
| elasticsearch线程池活跃的线程数 | elasticsearch_thread_pool_queue_count | elasticsearch_thread_pool_active_count{} |
| elasticsearch JVM GC 垃圾搜集数 | elasticsearch_jvm_gc_collection_seconds_count | irate(elasticsearch_jvm_gc_collection_seconds_count{}[5]) |
| elasticsearch线程池完成的线程数 | elasticsearch_thread_pool_completed_count | irate(elasticsearch_thread_pool_completed_count{}[5]) |

8.2 Prometheus 监控

我们可以通过prometheus来取得他的监控指标,如图:截取部分图指标展示:

8.3 Grafana 展示

通过grafana来对它的指标进行监控,如图所示:

相关推荐
jianghx10246 小时前
Docker部署ES,开启安全认证并且设置账号密码(已运行中)
安全·elasticsearch·docker·es账号密码设置
IT小哥哥呀6 小时前
电池制造行业数字化实施
大数据·制造·智能制造·数字化·mom·电池·信息化
Xi xi xi6 小时前
苏州唯理科技近期也正式发布了国内首款神经腕带产品
大数据·人工智能·经验分享·科技
yumgpkpm7 小时前
华为鲲鹏 Aarch64 环境下多 Oracle 、mysql数据库汇聚到Cloudera CDP7.3操作指南
大数据·数据库·mysql·华为·oracle·kafka·cloudera
UMI赋能企业8 小时前
制造业流程自动化提升生产力的全面分析
大数据·人工智能
TDengine (老段)8 小时前
TDengine 数学函数 FLOOR 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
派可数据BI可视化10 小时前
商业智能BI 浅谈数据孤岛和数据分析的发展
大数据·数据库·数据仓库·信息可视化·数据挖掘·数据分析
jiedaodezhuti11 小时前
Flink性能调优基石:资源配置与内存优化实践
大数据·flink
半梦半醒*11 小时前
搭建Jenkins
linux·运维·centos·tomcat·jenkins·运维开发
Lx35212 小时前
Flink窗口机制详解:如何处理无界数据流
大数据