k8s上部署Prometheus 步骤

1. 添加 Helm 仓库

bash

复制代码
helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo update

2. 创建命名空间(可选,推荐独立)

bash

复制代码
kubectl create namespace monitoring

3. 安装 kube-prometheus-stack

bash

复制代码
helm install prometheus prometheus-community/kube-prometheus-stack \
  --namespace monitoring \
  --set grafana.adminPassword=admin \
  --set prometheus.prometheusSpec.serviceMonitorSelectorNilUsesHelmValues=false
  • grafana.adminPassword:设置 Grafana admin 密码

  • 第二个 set 项:允许 ServiceMonitor 发现集群内其他 Helm 发布的服务,方便后续自动监控

你也可以自定义一个 values.yaml 文件,通过 -f values.yaml 传入。

4. 检查部署状态

bash

复制代码
kubectl get all -n monitoring

稍等几分钟,所有 Pod 进入 Running 状态。

5. 访问 Prometheus UI(可选端口转发)

bash

复制代码
kubectl port-forward -n monitoring svc/prometheus-kube-prometheus-prometheus 9090:9090

浏览器打开 http://localhost:9090

6. 访问 Grafana

bash

复制代码
kubectl port-forward -n monitoring svc/prometheus-grafana 80:80

浏览器 http://localhost,用户名 admin,密码为你设置的(如 admin


补充:如果你不想用 Helm,纯 YAML 部署

  1. 克隆官方 kube-prometheus 项目

    bash

    复制代码
    git clone https://github.com/prometheus-operator/kube-prometheus.git
    cd kube-prometheus
  2. 应用清单

    bash

    复制代码
    kubectl apply --server-side -f manifests/setup
    kubectl apply -f manifests/
  3. 删除(如需清理)

    bash

    复制代码
    kubectl delete --ignore-not-found=true -f manifests/ -f manifests/setup

部署后验证

  • 查看 target 状态:Prometheus UI → Status → Targets

  • 查看 Grafana 仪表盘:默认有 Kubernetes / Nodes / Pods 等预置面板


常见问题提示

  • 权限不足:确保你有 cluster-admin 权限或该命名空间下的足够 RBAC

  • 存储:如果未配置默认 StorageClass,Prometheus 的 PVC 会处于 Pending 状态,需要先配置存储类或修改 values 使用 emptyDir(临时)

  • 资源限制:生产环境建议调整 CPU/内存 requests 和 limits

如需更细粒度的配置(如持久化、服务暴露、告警规则),可以进一步提供你的集群信息,我可以给出定制化建议。

相关推荐
SelectDB11 小时前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生
WhoAmI11 小时前
MapReduce框架原理解析一:InputFormat
大数据·hadoop
WhoAmI11 小时前
MapReduce框架原理解析三:OutputFormat
大数据·hadoop
WhoAmI11 小时前
MapReduce框架原理解析二:Shuffle
大数据·hadoop
大大大大晴天1 天前
Hudi技术内幕:Key Generation原理与实践
大数据
得物技术5 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子5 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
大树885 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥1235 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能6 天前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居