高可用Kuberbetes部署Prometheus + Grafana

概述

阅读官方文档部署部署Prometheus + Grafana

GitHub - prometheus-operator/kube-prometheus at release-0.10

环境

步骤

下周官方github仓库

bash 复制代码
git clone https://github.com/prometheus-operator/kube-prometheus.git
git checkout release-0.10

进入工作目录

bash 复制代码
cd kube-prometheus/manifests
mkdir -p adapter  alertmanager  blackbox  grafana  kube-state-metrics  node-exporter  operator  prometheus

修改镜像地址

主要是镜像难寻,全靠运气。

prometheusAdapter-deployment.yaml

修改为:thinkingdata/prometheus-adapter:v0.10.0 镜像可用

kubeStateMetrics-deployment.yaml

修改为:bitnami/kube-state-metrics:2.7.0 镜像可用

部署服务

根据官方文档部署服务

bash 复制代码
kubectl apply --server-side -f manifests/setup
until kubectl get servicemonitors --all-namespaces ; do date; sleep 1; echo ""; done
kubectl apply -f manifests/

验证

NodePort服务暴露

由ClusterIP修改为NodePort

网页访问验证:

只能在指定的节点访问服务。

如图是:

  • node04访问grafana + Prometheus。
  • master03访问Prometheus

默认登录账号密码都为 admin 登录就会要求你重设密码,重设密码仍为admin

Ingress服务暴露

bash 复制代码
---
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: prom-ingress
  namespace: monitoring
spec:
  ingressClassName: nginx
  rules:
    - host: alert.k8s.com
      http:
        paths:
          - path: /
            pathType: Prefix
            backend:
              service:
                name: alertmanager-main
                port:
                  number: 9093

    - host: grafana.k8s.com
      http:
        paths:
          - path: /
            pathType: Prefix
            backend:
              service:
                name: grafana
                port:
                  number: 3000

    - host: prom.k8s.com
      http:
        paths:
          - path: /
            pathType: Prefix
            backend:
              service:
                name: prometheus-k8s
                port:
                  number: 9090

配置域名解析

配置Grafana

第一次登录账户密码都使用admin,详细教程参考:Grafana fundamentals | Grafana Labs

测试:

引入基本Dashboard

中文dashboard

K8S Dashboard CN 20211010 StarsL.cn | Grafana Labs

引入dashboard

导入刚才下载的json文件即可

查询其他Dashboard

Dashboards | Grafana Labs

成果:

配置邮件告警

查询grafana.ini配置在哪里

修改配置文件并重新部署kubectl apply -f grafana-config.yaml

Grafana配置SMTP接入邮箱 - 乱七八糟博客备份 - 博客园 (cnblogs.com)

grafana配置文件说明 - woaibaobei - 博客园 (cnblogs.com)

Grafana配置邮件告警_grafana配置邮件报警_lee_yanyi的博客-CSDN博客

删除grafana的原有pod,必须删除相当于重新加载配置

配置邮件发送SMTP其他邮件服务同理

测试联通性

安装插件

Error

ingress 部署失败

bash 复制代码
Error from server (InternalError): error when creating "ingress.yml": Internal error occurred: failed calling webhook "validate.nginx.ingress.kubernetes.io": Posetworking/v1/ingresses?timeout=10s": dial tcp 10.96.222.96:443: connect: connection refused

删除错误pod

kubectl get pod -n ingress-nginx | grep Evicted | awk '{print $1}' | xargs kubectl delete pod -n ingress-nginx

重新部署pod

kubectl delete pod/ingress-nginx-controller-6ff65d977f-q2kw9 -n ingress-nginx

备注

使用kube-prometheus部署k8s监控(最新版)_净夜凡尘的博客-CSDN博客

Deploy Grafana on Kubernetes | Grafana documentation

kubernetes 部署Prometheus监控集群传统部署方案_ghostwritten的博客-CSDN博客

GitHub - starsliao/Prometheus: Grafana Dashboards for Prometheus Exporter

相关推荐
阿里云云原生30 分钟前
相约 GenAICon 北京站:聊聊从环境工程出发,如何“简化”多源实时上下文?
云原生
Dontla2 小时前
Prometheus介绍(开源系统监控与告警工具)(时间序列数据库TSDB、标签化label-based多维分析、Pull模型、PromQL查询语言)
数据库·开源·prometheus
数字化顾问2 小时前
(88页PPT)DG1092D1S4培训课件EASGERP总体架构基础(附下载方式)
微服务·云原生·架构
x10n93 小时前
基于提示词驱动的Function Call实现K8s Pod智能诊断
ai·云原生·容器·kubernetes
阿里云云原生3 小时前
当运维遇见本体论:Umodel 打造 IT 世界的统一认知地图
云原生
lagrahhn4 小时前
无服务器计算简单介绍
云原生·云计算·无服务器
张3235 小时前
ConfigMap
云原生·kubernetes
东北甜妹5 小时前
Docker 命令
云原生·eureka
倔强的胖蚂蚁6 小时前
Ollama 大模型参数调整
运维·人工智能·云原生
文静小土豆21 小时前
Java 应用上 K8s 全指南:从部署到治理的生产级实践
java·开发语言·kubernetes