单节点K8s上安装Prometheus

目录

[使用 Helm 部署(推荐)](#使用 Helm 部署(推荐))

[1. 安装 Helm](#1. 安装 Helm)

[2. 添加 Prometheus Helm 仓库](#2. 添加 Prometheus Helm 仓库)

[3. 创建命名空间](#3. 创建命名空间)

4.安装

检查外部访问信息

遇到镜像问题


Helm 和Prometheus是什么?

Helm是 Kubernetes 的包管理工具,能极大简化应用的部署和管理。这是最快捷、最省心的方式。就像:

  • Ubuntu 的 APT
  • CentOS 的 YUM

Prometheus开源的监控系统,Kubernetes 集群的"眼睛和耳朵",用于:

  • 收集各种指标(CPU、内存、网络等)
  • 提供查询接口和告警机制
  • 成为监控 Kubernetes 集群的行业标准

具体安装步骤

1. 安装 Helm

如果尚未安装 Helm,可以通过官方脚本安装:

复制代码
curl -fsSL -o get_helm.sh https://raw.githubusercontent.com/helm/helm/main/scripts/get-helm-3
chmod 700 get_helm.sh
./get_helm.sh

2. 添加 Prometheus Helm 仓库

Helm 通过"图表"来管理应用,首先需要添加包含 Prometheus 图表的仓库:

复制代码
helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo update

3. 创建命名空间

为监控组件创建一个独立的命名空间,是个好习惯:

复制代码
kubectl create namespace monitoring

重要配置 :默认安装可能不使用持久化存储,这意味着重启后数据会丢失。对于生产环境,建议通过自定义 values.yaml文件启用持久化存储。

4.安装Prometheus

复制代码
helm install my-prometheus-stack prometheus-community/kube-prometheus-stack \
  --namespace monitoring \
  --create-namespace \
  --set grafana.service.type=NodePort \
  --set grafana.service.nodePort=30080 \
  --set grafana.adminPassword="admin" \
  --set prometheus.service.type=NodePort \
  --set prometheus.service.nodePort=30090 \
  --set alertmanager.service.type=NodePort \
  --set alertmanager.service.nodePort=30093

检查外部访问信息

安装成功后,查看如何从外部访问:

复制代码
# 获取服务器 IP
SERVER_IP=$(hostname -I | awk '{print $1}')

# 获取 NodePort 端口
kubectl get svc -n monitoring -o jsonpath='{range .items[*]}{.metadata.name}{": http://'$SERVER_IP':"}{.spec.ports[0].nodePort}{"\n"}{end}'

您现在可以先运行helm list -A和 kubectl get pods -n monitoring来了解当前的安装状态。

安装成功后,您可以通过以下地址访问:

  • Grafana : http://<服务器IP>:30080(用户名:admin,密码:admin

  • Prometheus : http://<服务器IP>:30090

  • Alertmanager : http://<服务器IP>:30093

遇到镜像问题

复制代码
#查看状态
kubectl get pods -n monitoring


编辑deployment文件:
kubectl edit deployment prometheus-kube-state-metrics -n monitoring

使用下面镜像加速网站,将源deployement文件中镜像换成加速后的地址重新删除pod,便会自动重新拉去。

https://console.ucloud.cn/

复制代码
编辑deployment文件:
kubectl edit deployment prometheus-kube-state-metrics -n monitoring
获取所有pod:
kubectl get pods -n monitoring
删除pod,会自动重新拉取:
kubectl delete pod -n monitoring prometheus-kube-state-metrics-5b667b7f89-97bhh
重启服务
kubectl rollout restart deployment prometheus-server -n monitoring

检查服务状态:
kubectl get svc -n monitoring
相关推荐
是阿楷啊1 天前
Java大厂面试场景:音视频场景中的Spring Boot与微服务实战
spring boot·redis·spring cloud·微服务·grafana·prometheus·java面试
xixingzhe22 天前
Prometheus+Grafana监控服务器
grafana·prometheus
牛奶咖啡132 天前
Prometheus+Grafana构建云原生分布式监控系统(十六) _基于Alertmanager的告警机制(一)
云原生·prometheus·prometheus告警整合·prometheus告警配置·prometheus告警规则·prometheus触发告警·告警规则配置实践
码农小卡拉4 天前
Prometheus 监控 SpringBoot 应用完整教程
spring boot·后端·grafana·prometheus
牛奶咖啡134 天前
Prometheus+Grafana构建云原生分布式监控系统(十五)_Prometheus中PromQL使用(二)
云原生·prometheus·集合运算·对查询结果排序·直方图原理·统计掉线的实例·检查节点或指标是否存在
牛奶咖啡135 天前
Prometheus+Grafana构建云原生分布式监控系统(十四)_Prometheus中PromQL使用(一)
云原生·prometheus·promql·计算一个时间范围内的平均值·将相同数据整合查看整体趋势·计算时间范围内的最大最小比率·向量标量的算术运算
牛奶咖啡136 天前
Prometheus+Grafana构建云原生分布式监控系统(十三)_Prometheus数据模型及其PromQL
云原生·prometheus·prometheus数据类型·promql使用场景·promql表达式解析·promql数据类型·监控系统的方法论与指标
AC赳赳老秦7 天前
外文文献精读:DeepSeek翻译并解析顶会论文核心技术要点
前端·flutter·zookeeper·自动化·rabbitmq·prometheus·deepseek
牛奶咖啡138 天前
Prometheus+Grafana构建云原生分布式监控系统(十二)_基于DNS的服务发现
云原生·prometheus·dns·搭建自己的dns服务器·使用bind搭建dns服务器·配置正向解析·基于dns的服务发现
A-刘晨阳9 天前
Prometheus + Grafana + Alertmanager 实现邮件监控告警及配置告警信息
运维·云计算·grafana·prometheus·监控·邮件