腾讯mini项目-【指标监控服务重构】2023-07-30

今日已办

调研 CPU & Memory

Cadivisor

Cadivisor -> Prometheus -> (Grafana / SigNoz Web)

google/cadvisor: Analyzes resource usage and performance characteristics of running containers. (github.com)

yaml 复制代码
services:
  cadvisor:
    image: gcr.io/cadvisor/cadvisor:latest
    container_name: cadvisor
    ports:
      - 8888:8080
    volumes:
      - /:/rootfs:ro
      - /var/run:/var/run:rw
      - /sys:/sys:ro
      - /var/lib/docker/:/var/lib/docker:ro

Host Metrics Receiver

OpenTelemetry Host Metrics Receiver是一个OpenTelemetry收集器,用于收集主机级别的度量数据,例如CPU使用率、磁盘使用率和内存使用率等。该收集器可以通过多种方式获取主机度量数据,例如使用系统监视器(如Prometheus)或通过在主机上安装代理程序(如cAdvisor)。

OpenTelemetry Host Metrics Receiver支持多种操作系统和平台,包括Linux、Windows和MacOS等。它可以与OpenTelemetry Collector一起使用,以便将主机度量数据发送到多个目标(如Prometheus、Grafana和SigNoz等)进行处理和分析。

Host Metrics Receiver插件是用于收集主机级别的度量数据,例如CPU使用率、内存使用率等,而不是容器级别的度量数据。因此,它不支持直接指定要收集特定容器的指标。

如果想要收集特定容器的度量数据,可以考虑使用另一个OpenTelemetry收集器插件,例如Docker Stats Receiver。Docker Stats Receiver插件可以收集Docker容器的度量数据,例如CPU使用率、内存使用率、网络流量等。

Docker Stats Receiver

dockerstatsreceiver package - github.com/open-telemetry/opentelemetry-collector-contrib/receiver/dockerstatsreceiver - Go Packages

Docker Stats 接收器按照配置的时间间隔查询本地 Docker 守护进程的容器统计 API,以获取所有所需的正在运行的容器。这些统计信息适用于 cpu、内存、网络和 blkio 控制器的容器资源使用情况。

目前 Docker Stats Receiver 插件不能在 Windows 操作系统上运行。这是因为 Docker Stats API 在 Windows 上不可用。

Docker Stats API 仅在 Docker守护程序运行的主机上提供。在 Linux 环境中,Docker Stats API 使用/var/run/docker.sock Unix套接字与守护程序通信。

但是,在 Windows 上,Docker 守护程序不使用 Unix 套接字,而是使用 TCP 套接字 进行通信,并使用不同的 API 端点

本想尝试在服务器上部署,测试是否生效,但是由于环境与版本不同,docker compose 无法正常运行

修改了部分配置的结构可以正常运行,但是更新了 docker 的镜像源依然拉取失败

组会记录

项目对齐和汇总问题

  • 总体完成了导师 comment 的代码改进【移除 Prometheus 的相关配置还未完成】
  • 讨论 CPU & Memory 的收集
    • 关于 Host Metrics Receiver 的补充

明日待办

  • 组长会议汇报进度和问题
  • 继续调研收集 CPU & Memroy
相关推荐
Dobby_0511 小时前
【Go】C++ 转 Go 第(二)天:变量、常量、函数与init函数
vscode·golang·go
光头闪亮亮12 小时前
Golang使用gofpdf库和barcode库创建PDF原材料二维码标签【GBK中文或UTF8】及预览和打印
go
光头闪亮亮15 小时前
go-fitz库-PDF文件所有页转换到HTML及从HTML中提取图片的示例教程
go
用户8556514144616 小时前
环信http请求失败排查
go
大数据001 天前
CLICKHOUSE分布式表初体验
分布式·clickhouse
专注VB编程开发20年1 天前
产品更新与重构策略:创新与稳定的平衡之道
重构·erp·进销存
hqyjzsb1 天前
2025年市场岗位能力重构与跨领域转型路径分析
c语言·人工智能·信息可视化·重构·媒体·改行学it·caie
rengang661 天前
智能化的重构建议:大模型分析代码结构,提出可读性和性能优化建议
人工智能·性能优化·重构·ai编程
一尘之中1 天前
觉醒的拓扑学:在量子纠缠与神经幻象中重构现实认知
人工智能·重构
言之。1 天前
ClickHouse 数据更新策略深度解析:突变操作与最佳实践
服务器·数据库·clickhouse