Prometheus监控Pod

基础学习

cAdvisor由谷歌开源,cAdvisor不仅可以搜集一台机器上所有运行的容器信息,还提供基础查询界面和Http接口,方便其他组件如Prometheus进行数据抓取,cAdvisor可以对节点机器上的资源及容器进行实时监控和性能数据采集,包括CPU使用情况,内存使用情况,网络吞吐量及文件系统使用情况

节点部署情况

系统 IP 服务
Ubuntu22.04 192.168.202.221 Prometheus, grafana, blackbox exporter, node exporter ,k8s master
Ubuntu22.04 192.168.202.222 node exporter , k8s worker
Ubuntu22.04 192.168.202.223 node exporter, k8s worker
Ubuntu22.04 192.168.202.224 node exporter , k8s worker

项目地址

github.com/google/cadv...

部署cAdvisor

下载

由于advisor的镜像在gcr.io仓库里,因此本人在docker hub推了一个最新的版本 postkarte/cadvisor:latest

运行容器

在所有k8s相关的节点上都运行容器

sh 复制代码
sudo docker run \
  --volume=/:/rootfs:ro \
  --volume=/var/run:/var/run:ro \
  --volume=/sys:/sys:ro \
  --volume=/var/lib/docker/:/var/lib/docker:ro \
  --volume=/dev/disk/:/dev/disk:ro \
  --publish=8080:8080 \
  --detach=true \
  --name=cadvisor \
  --privileged \
  --device=/dev/kmsg \
  postkarte/cadvisor:latest

查看运行结果

sh 复制代码
root@node1:~# docker ps
CONTAINER ID   IMAGE                       COMMAND                  CREATED         STATUS                            PORTS                                       NAMES
8695ddf2c9bb   postkarte/cadvisor:latest   "/usr/bin/cadvisor -..."   6 seconds ago   Up 5 seconds (health: starting)   0.0.0.0:8080->8080/tcp, :::8080->8080/tcp   cadvisor

在Prometheus中添加cAdvisor

在Prometheus中配置一个job,添加容器的监控

yaml 复制代码
  - job_name: "k8s-containers"
    static_configs:
      - targets: ["192.168.202.221:8080","192.168.202.222:8080","192.168.202.223:8080","192.168.202.224:8080"]

检查配置文件是否正确

sh 复制代码
root@node1:/usr/local/prometheus# ./promtool check config prometheus.yml 
Checking prometheus.yml
 SUCCESS: prometheus.yml is valid prometheus config file syntax

重启Prometheus

sh 复制代码
systemctl restart prometheus

可以看到k8s采集到数据了

在Grafana中导入模板展示数据

导入id为315的dashboard

查看效果

相关推荐
在屏幕前出油1 小时前
00. FastAPI——了解FastAPI
后端·python·pycharm·fastapi
iPadiPhone1 小时前
Spring Boot 自动装配原理与 Starter 开发实战
java·spring boot·后端·spring·面试
程序员爱钓鱼1 小时前
Go字符串与数值转换核心库:strconv深度解析
后端·面试·go
码匠君1 小时前
首个基于 Spring Boot 4 的正式版发布!Dante Cloud 4.X 新特性全解析
java·spring boot·后端
Rust语言中文社区1 小时前
【Rust日报】 CEL与Rust实现接近原生速度的解释执行
开发语言·后端·rust
武子康1 小时前
大数据-247 离线数仓 - 电商分析 Hive 拉链表实战:订单历史状态增量刷新、闭链逻辑与错误排查
大数据·后端·apache hive
Natalia_Portman1 小时前
springboot整合DolphinDB
java·数据库·spring boot·后端·db
小码哥_常1 小时前
JWT从入门到精通:一文解锁生成、验证与防篡改秘籍
后端
小码哥_常1 小时前
Spring Boot 实现分片上传+断点续传+实时进度条,彻底解决大文件上传痛点!
后端
壹米饭2 小时前
QuestDB 磁盘满故障恢复实战指南
数据库·后端