k8s基础监控promql

PromQL 基础语法

PromQL(Prometheus Query Language)是 Prometheus 的时间序列数据查询语言,用于监控 Kubernetes 集群中的资源指标。以下是核心语法和示例:

即时向量查询

直接查询时间序列的当前值:

promql 复制代码
node_memory_MemTotal_bytes  # 查询节点内存总量
container_cpu_usage_seconds_total  # 查询容器CPU使用时间
范围向量查询

查询指定时间范围内的数据:

promql 复制代码
node_cpu_seconds_total[5m]  # 过去5分钟的CPU时间
kube_pod_container_resource_limits_cpu_cores[1h]  # 过去1小时的CPU限制
运算符

支持算术、比较和逻辑运算:

promql 复制代码
node_memory_MemFree_bytes / node_memory_MemTotal_bytes * 100  # 计算内存空闲百分比
kube_pod_status_phase{phase="Running"} == 1  # 筛选运行中的Pod
聚合函数

对数据进行聚合计算:

promql 复制代码
sum(rate(container_cpu_usage_seconds_total[5m])) by (pod)  # 按Pod聚合CPU使用率
avg(kube_node_status_allocatable_memory_bytes)  # 计算节点平均可分配内存

常用 Kubernetes 监控指标

节点资源监控
promql 复制代码
# CPU使用率
100 - (avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) by (instance) * 100)

# 内存使用率
(node_memory_MemTotal_bytes - node_memory_MemFree_bytes - node_memory_Buffers_bytes - node_memory_Cached_bytes) / node_memory_MemTotal_bytes * 100

# 磁盘使用率
100 - (node_filesystem_free_bytes{mountpoint="/"} / node_filesystem_size_bytes{mountpoint="/"} * 100)
Pod 和容器监控
promql 复制代码
# Pod CPU使用量
sum(rate(container_cpu_usage_seconds_total{image!=""}[5m])) by (pod)

# Pod 内存使用量
sum(container_memory_working_set_bytes{image!=""}) by (pod)

# 容器重启次数
sum(kube_pod_container_status_restarts_total) by (container)
服务监控
promql 复制代码
# HTTP请求成功率
sum(rate(http_requests_total{status=~"2.."}[5m])) / sum(rate(http_requests_total[5m])) * 100

# 请求延迟百分位
histogram_quantile(0.95, sum(rate(http_request_duration_seconds_bucket[5m])) by (le))

实用技巧

标签过滤

使用 {} 筛选特定标签:

promql 复制代码
kube_pod_info{namespace="default"}  # 查询default命名空间的Pod信息
container_memory_usage_bytes{pod="nginx-xyz"}  # 查询特定Pod的内存使用
动态标签匹配

正则匹配标签值:

promql 复制代码
kube_pod_info{namespace=~"dev|test"}  # 匹配dev或test命名空间
kube_service_labels{label_env!="production"}  # 排除生产环境标签
预测与告警

基于趋势预测资源不足:

promql 复制代码
# 预测24小时内磁盘写满
predict_linear(node_filesystem_free_bytes{mountpoint="/"}[6h], 3600*24) < 0

注意事项

  1. 范围向量需搭配函数(如 rate())使用,否则返回空数据。
  2. 避免高频查询,长时间范围查询可能消耗大量资源。
  3. 使用 bywithout 控制聚合维度,确保结果可读性。

通过以上 PromQL 查询,可以全面监控 Kubernetes 集群的节点、Pod、服务等核心组件的状态和性能。

相关推荐
张小凡vip2 分钟前
Kubernetes--k8s中部署redis数据库服务
redis·kubernetes
Hello.Reader1 小时前
Flink Kubernetes HA(高可用)实战原理、前置条件、配置项与数据保留机制
贪心算法·flink·kubernetes
ShiLiu_mtx2 小时前
k8s - 7
云原生·容器·kubernetes
MonkeyKing_sunyuhua5 小时前
docker compose up -d --build 完全使用新代码打包的方法
docker·容器·eureka
醇氧6 小时前
【docker】mysql 8 的健康检查(Health Check)
mysql·docker·容器
匀泪9 小时前
云原生(LVS NAT模式集群实验)
服务器·云原生·lvs
70asunflower9 小时前
用Docker创建不同的容器类型
运维·docker·容器
CodeGolang10 小时前
Docker容器化部署Zabbix监控系统完整指南
docker·容器·zabbix
DolitD10 小时前
云流技术深度剖析:国内云渲染主流技术与开源和海外厂商技术实测对比
功能测试·云原生·开源·云计算·实时云渲染
ghostwritten11 小时前
春节前夕,运维的「年关」:用 Kubeowler 给集群做一次「年终体检」
运维·云原生·kubernetes