【亚马逊云科技】使用Helm 3为Amazon EKS部署Prometheus+Grafana监控平台

文章目录

      • [1. 创建Kubernetes命名空间](#1. 创建Kubernetes命名空间)
      • [2. 添加Prometheus社区helm chart](#2. 添加Prometheus社区helm chart)
      • [3. 安装prometheus](#3. 安装prometheus)
      • [4. 检查Prometheus Pod运行状况](#4. 检查Prometheus Pod运行状况)
      • [5. 检查Prometheus Service部署情况](#5. 检查Prometheus Service部署情况)
      • [6. 修改服务访问端口类型](#6. 修改服务访问端口类型)
      • [7. 访问Prometheus数据收集情况](#7. 访问Prometheus数据收集情况)
      • [8. 访问Grafana](#8. 访问Grafana)
      • [9. 设置数据源](#9. 设置数据源)
      • [10. 查看Kubernetes各类性能可视化参数信息](#10. 查看Kubernetes各类性能可视化参数信息)

1. 创建Kubernetes命名空间

首先,创建一个 Kubernetes 命名空间,并使用 helm 来部署 stable/monitoring 软件包:

shell 复制代码
$ kubectl create namespace monitoring

操作过程演示:

bash 复制代码
[ec2-user@ip-172-31-37-104 ~]$ kubectl create namespace monitoring 
namespace/monitoring  created

[ec2-user@ip-172-31-37-104 ~]$ kubectl get ns
NAME              STATUS   AGE
default           Active   153m
kube-node-lease   Active   153m
kube-public       Active   153m
kube-system       Active   153m
monitoring        Active   86m

2. 添加Prometheus社区helm chart

其次,添加 Prometheus 社区helm chart:

bash 复制代码
$ helm repo add prometheus-community https://prometheus-community.github.io/helm-charts

$ helm repo update

$ helm repo list

$ helm search repo stable/prometheus-operator
$ helm search repo prometheus-operator

操作过程演示:

bash 复制代码
[ec2-user@ip-172-31-37-104 ~]$ helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
"prometheus-community" already exists with the same configuration, skipping

[ec2-user@ip-172-31-37-104 ~]$ helm repo update
Hang tight while we grab the latest from your chart repositories...
...Successfully got an update from the "grafana" chart repository
...Successfully got an update from the "prometheus-community" chart repository
...Successfully got an update from the "stable" chart repository
Update Complete. ⎈Happy Helming!⎈

[ec2-user@ip-172-31-37-104 ~]$ helm repo list
NAME                    URL
prometheus-community    https://prometheus-community.github.io/helm-charts
grafana                 https://grafana.github.io/helm-charts
stable                  https://charts.helm.sh/stable

[ec2-user@ip-172-31-37-104 ~]$ helm search repo prometheus-community/prometheus-operator
NAME                            CHART VERSION   APP VERSION     DESCRIPTION
stable/prometheus-operator      9.3.2           0.38.1          DEPRECATED Provides easy monitoring definitions...

3. 安装prometheus

接着,使用helm install安装prometheus:

bash 复制代码
helm install stable prometheus-community/kube-prometheus-stack --debug

创建过程显示正常,最后会输出如下内容:

nash 复制代码
NOTES:
kube-prometheus-stack has been installed. Check its status by running:
  kubectl --namespace default get pods -l "release=stable"

Visit https://github.com/prometheus-operator/kube-prometheus for instructions on how to create & configure Alertmanager and Prometheus instances using the Operator.

4. 检查Prometheus Pod运行状况

最后,检查Prometheus Pods的部署情况。

bash 复制代码
[ec2-user@ip-172-31-37-104 ~]$ kubectl get pods -n monitoring
NAME                                                     READY   STATUS    RESTARTS   AGE
alertmanager-stable-kube-prometheus-sta-alertmanager-0   2/2     Running   0          131m
prometheus-stable-kube-prometheus-sta-prometheus-0       2/2     Running   0          131m
stable-grafana-58b76cd9d7-tgd8r                          3/3     Running   0          131m
stable-kube-prometheus-sta-operator-7699d6bfb8-zx8jn     1/1     Running   0          131m
stable-kube-state-metrics-65f45c47c9-5zmj5               1/1     Running   0          131m
stable-prometheus-node-exporter-2q98d                    1/1     Running   0          126m
stable-prometheus-node-exporter-98cf4                    1/1     Running   0          131m
stable-prometheus-node-exporter-d6jnm                    1/1     Running   0          128m
stable-prometheus-node-exporter-gp5dh                    1/1     Running   0          131m
stable-prometheus-node-exporter-gqqls                    1/1     Running   0          128m
stable-prometheus-node-exporter-sqg6x                    1/1     Running   0          126m
[ec2-user@ip-172-31-37-104 ~]$

5. 检查Prometheus Service部署情况

检查部署完成的服务 kubectl get svc

bash 复制代码
$ kubectl get svc -n monitoring

检查部署完成的Prometheus Pods可以看到每个节点都运行了 node-exporter 且已经运行起 Prometheus和Grafana

bash 复制代码
[ec2-user@ip-172-31-37-104 ~]$ kubectl get svc -n monitoring
NAME                                      TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)                         AGE
alertmanager-operated                     ClusterIP   None             <none>        9093/TCP,9094/TCP,9094/UDP      79m
prometheus-operated                       ClusterIP   None             <none>        9090/TCP                        79m
stable-grafana                            NodePort    10.100.215.171   <none>        80:32311/TCP                    79m
stable-kube-prometheus-sta-alertmanager   ClusterIP   10.100.237.236   <none>        9093/TCP,8080/TCP               79m
stable-kube-prometheus-sta-operator       ClusterIP   10.100.79.75     <none>        443/TCP                         79m
stable-kube-prometheus-sta-prometheus     NodePort    10.100.141.226   <none>        9090:31634/TCP,8080:31429/TCP   79m
stable-kube-state-metrics                 ClusterIP   10.100.222.140   <none>        8080/TCP                        79m
stable-prometheus-node-exporter           ClusterIP   10.100.168.39    <none>        9100/TCP                        79m

6. 修改服务访问端口类型

🛑情况说明:默认情况下, prometheusgrafana 服务都是使用ClusterIP在集群内部,所以要能够在外部访问,需要使用 NodePort


✅操作内容:修改 stable-kube-prometheus-sta-prometheus 服务和 stable-grafana 服务配置文件中的内容,将 typeClusterIP 修改为 NodePort

bash 复制代码
$ kubectl edit svc stable-grafana
bash 复制代码
$ kubectl edit svc stable-kube-prometheus-sta-prometheus

执行kubectl get svc -n monitoring命令,查看对应服务访问的外置端口。

注意:检查对应的主机安全组的端口是否开启。

7. 访问Prometheus数据收集情况

访问Prometheus数据收集情况。其中一个集群工作节点的IP地址+prometheus端口。

8. 访问Grafana

访问Grafana。对Amazon EKS中的数据进行数据可观测性查看。其中一个集群工作节点的IP地址+grafana端口。


访问 Grafana 面板,初始账号 admin 密码是 prom-operator ,请立即修改

9. 设置数据源

1、设置名称。设置为默认数据源


2、Prometheus server URL:Prometheus的SVC对应的Cluster-IP

  • 点击"Save & test"保存并测试。输出结果如下所示,表示成功。

10. 查看Kubernetes各类性能可视化参数信息

  • 查看Kubernetes网络工作负载
  • 查看Kubernetes Pod网络传输情况
  • 查看Kubernetes 服务器接口
  • 查看需要Kubelet命令查询操作的数据
  • 查看Kubernetes Proxy
  • 全局查看Prometheus
  • 查看集群工作节点的系统配置参数信息



相关推荐
武子康3 天前
大数据-218 Prometheus 插件 exporter 与 pushgateway 配置使用 监控服务 使用场景
大数据·hive·hadoop·flink·spark·prometheus
管理大亨3 天前
K8S之Prometheus 部署(二十)
docker·kubernetes·prometheus
ID_云泽4 天前
使用docker部署Prometheus和Grafana去监控mysql和redis
运维·grafana·prometheus·性能监控
福大大架构师每日一题5 天前
30.1 时序数据库TSDB的典型特点
prometheus
聆听--风雨6 天前
多client向同一个pushgateway推送指标被覆盖问题
prometheus
川石课堂软件测试7 天前
性能测试|docker容器下搭建JMeter+Grafana+Influxdb监控可视化平台
运维·javascript·深度学习·jmeter·docker·容器·grafana
逻辑与&&8 天前
[Prometheus学习笔记]从架构到案例,一站式教程
笔记·学习·prometheus
Walden-20208 天前
构建基于 DCGM-Exporter, Node exporter,PROMETHEUS 和 GRAFANA 构建算力监控系统
docker·容器·grafana·prometheus
牛角上的男孩9 天前
部署Prometheus、Grafana、Zipkin、Kiali监控度量Istio
grafana·prometheus·istio
福大大架构师每日一题10 天前
文心一言 VS 讯飞星火 VS chatgpt (383)-- 算法导论24.5 3题
prometheus