Prometheus监控Pod

基础学习

cAdvisor由谷歌开源,cAdvisor不仅可以搜集一台机器上所有运行的容器信息,还提供基础查询界面和Http接口,方便其他组件如Prometheus进行数据抓取,cAdvisor可以对节点机器上的资源及容器进行实时监控和性能数据采集,包括CPU使用情况,内存使用情况,网络吞吐量及文件系统使用情况

节点部署情况

系统 IP 服务
Ubuntu22.04 192.168.202.221 Prometheus, grafana, blackbox exporter, node exporter ,k8s master
Ubuntu22.04 192.168.202.222 node exporter , k8s worker
Ubuntu22.04 192.168.202.223 node exporter, k8s worker
Ubuntu22.04 192.168.202.224 node exporter , k8s worker

项目地址

github.com/google/cadv...

部署cAdvisor

下载

由于advisor的镜像在gcr.io仓库里,因此本人在docker hub推了一个最新的版本 postkarte/cadvisor:latest

运行容器

在所有k8s相关的节点上都运行容器

sh 复制代码
sudo docker run \
  --volume=/:/rootfs:ro \
  --volume=/var/run:/var/run:ro \
  --volume=/sys:/sys:ro \
  --volume=/var/lib/docker/:/var/lib/docker:ro \
  --volume=/dev/disk/:/dev/disk:ro \
  --publish=8080:8080 \
  --detach=true \
  --name=cadvisor \
  --privileged \
  --device=/dev/kmsg \
  postkarte/cadvisor:latest

查看运行结果

sh 复制代码
root@node1:~# docker ps
CONTAINER ID   IMAGE                       COMMAND                  CREATED         STATUS                            PORTS                                       NAMES
8695ddf2c9bb   postkarte/cadvisor:latest   "/usr/bin/cadvisor -..."   6 seconds ago   Up 5 seconds (health: starting)   0.0.0.0:8080->8080/tcp, :::8080->8080/tcp   cadvisor

在Prometheus中添加cAdvisor

在Prometheus中配置一个job,添加容器的监控

yaml 复制代码
  - job_name: "k8s-containers"
    static_configs:
      - targets: ["192.168.202.221:8080","192.168.202.222:8080","192.168.202.223:8080","192.168.202.224:8080"]

检查配置文件是否正确

sh 复制代码
root@node1:/usr/local/prometheus# ./promtool check config prometheus.yml 
Checking prometheus.yml
 SUCCESS: prometheus.yml is valid prometheus config file syntax

重启Prometheus

sh 复制代码
systemctl restart prometheus

可以看到k8s采集到数据了

在Grafana中导入模板展示数据

导入id为315的dashboard

查看效果

相关推荐
جيون داد ناالام ميづ42 分钟前
Spring Boot 核心原理(五):配置管理怎么玩?从基础到多环境再到配置中心
java·spring boot·后端
_小九1 小时前
【开源】耗时数月、我开发了一款功能全面【30W行代码】的AI图床
前端·后端·开源
疯狂的程序猴1 小时前
完整指南:iPhone崩溃日志查看与分析方法及低内存崩溃处理
后端
秧歌star5191 小时前
PageHelper 分页失效原因分析与正确实践
后端
疯狂的程序猴1 小时前
苹果iOS应用签名与上架App Store完整指南包括注意事项
后端
回家路上绕了弯1 小时前
生产环境服务器变慢?从应急到根因的全流程诊断处理指南
分布式·后端
小胖霞1 小时前
Node+Express+MySQL 后端生产环境部署,实现注册功能(三)
前端·后端
aiopencode1 小时前
抓包技术全面指南:原理、工具与应用场景
后端
该用户已不存在2 小时前
Gemini 3.0 发布,Antigravity 掀桌,程序员何去何从?
后端·ai编程·gemini
aiopencode2 小时前
软件苹果商城上架的流程与团队协作模式 一个项目从开发到发布的完整经历
后端