目录
[使用 Helm 部署(推荐)](#使用 Helm 部署(推荐))
[1. 安装 Helm](#1. 安装 Helm)
[2. 添加 Prometheus Helm 仓库](#2. 添加 Prometheus Helm 仓库)
[3. 创建命名空间](#3. 创建命名空间)
Helm 和Prometheus是什么?
Helm是 Kubernetes 的包管理工具,能极大简化应用的部署和管理。这是最快捷、最省心的方式。就像:
- Ubuntu 的 APT
- CentOS 的 YUM
Prometheus 是开源的监控系统,Kubernetes 集群的"眼睛和耳朵",用于:
- 收集各种指标(CPU、内存、网络等)
- 提供查询接口和告警机制
- 成为监控 Kubernetes 集群的行业标准

具体安装步骤
1. 安装 Helm
如果尚未安装 Helm,可以通过官方脚本安装:
curl -fsSL -o get_helm.sh https://raw.githubusercontent.com/helm/helm/main/scripts/get-helm-3
chmod 700 get_helm.sh
./get_helm.sh
2. 添加 Prometheus Helm 仓库
Helm 通过"图表"来管理应用,首先需要添加包含 Prometheus 图表的仓库:
helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo update
3. 创建命名空间
为监控组件创建一个独立的命名空间,是个好习惯:
kubectl create namespace monitoring
重要配置 :默认安装可能不使用持久化存储,这意味着重启后数据会丢失。对于生产环境,建议通过自定义 values.yaml文件启用持久化存储。
4.安装Prometheus
helm install my-prometheus-stack prometheus-community/kube-prometheus-stack \
--namespace monitoring \
--create-namespace \
--set grafana.service.type=NodePort \
--set grafana.service.nodePort=30080 \
--set grafana.adminPassword="admin" \
--set prometheus.service.type=NodePort \
--set prometheus.service.nodePort=30090 \
--set alertmanager.service.type=NodePort \
--set alertmanager.service.nodePort=30093
检查外部访问信息
安装成功后,查看如何从外部访问:
# 获取服务器 IP
SERVER_IP=$(hostname -I | awk '{print $1}')
# 获取 NodePort 端口
kubectl get svc -n monitoring -o jsonpath='{range .items[*]}{.metadata.name}{": http://'$SERVER_IP':"}{.spec.ports[0].nodePort}{"\n"}{end}'
您现在可以先运行helm list -A和 kubectl get pods -n monitoring来了解当前的安装状态。
安装成功后,您可以通过以下地址访问:
-
Grafana :
http://<服务器IP>:30080(用户名:admin,密码:admin) -
Prometheus :
http://<服务器IP>:30090 -
Alertmanager :
http://<服务器IP>:30093
遇到镜像问题
#查看状态
kubectl get pods -n monitoring
编辑deployment文件:
kubectl edit deployment prometheus-kube-state-metrics -n monitoring
使用下面镜像加速网站,将源deployement文件中镜像换成加速后的地址重新删除pod,便会自动重新拉去。
编辑deployment文件:
kubectl edit deployment prometheus-kube-state-metrics -n monitoring
获取所有pod:
kubectl get pods -n monitoring
删除pod,会自动重新拉取:
kubectl delete pod -n monitoring prometheus-kube-state-metrics-5b667b7f89-97bhh
重启服务
kubectl rollout restart deployment prometheus-server -n monitoring
检查服务状态:
kubectl get svc -n monitoring
