服务器突然卡了却找不到原因?cAdvisor让每个容器都透明可见

前言

服务器莫名其妙变慢,你打开top看了一眼,CPU打满,但进程列表里全是容器名,看不出到底是哪个在折腾你。

磁盘又满了。你删日志、清缓存,结果第二天又满了。还是找不到元凶。

想看看某个容器具体用了多少内存、网络跑了多少流量,打开docker stats,手动刷新,数据一闪而过,没有历史记录,无法对比。

这三个场景但凡中过一条,你就知道这种"容器在跑但看不见"的处境有多难受。不是监控没用,是你没装对东西。

cAdvisor就是来解决这个的。Google开源,一条命令跑起来,本机8087端口直接出Web界面,所有容器CPU、内存、磁盘、网络一目了然,图表都是实时刷新的。

零配置,零门槛,装完立刻有数据。

本文将用最通俗的语言,带你从 "完全没听过cAdvisor" 到 "成功部署并看懂监控图表",手把手教你把"黑盒"容器变成"透明玻璃箱"。

准备好了吗?让我们一起告别盲跑,开启Docker可观测性第一步!

1.什么是cAdvisor?

cAdvisor(Container Advisor) 是Google开源的一款轻量级容器监控工具,专门用来实时收集、分析和展示Docker容器(以及其他容器运行时)的资源使用情况。

用大白话来说:

  • cAdvisor就像给你的每个容器装了一个"健康手环"------它能告诉你CPU跑得多快、内存用了多少、磁盘读写多频繁、网络流量有多大。

cAdvisor能监控什么?

  • CPU使用率
  • 内存用量(包括缓存、RSS等)
  • 磁盘 I/O(读写速度、次数)
  • 网络 I/O(收发流量)
  • 容器元数据(如镜像名、启动时间、标签等)
  • 宿主机整体资源使用情况

它怎么工作?

  • cAdvisor以一个独立容器或进程运行在你的服务器上。
  • 它会自动发现本机所有正在运行的容器(基于Docker、containerd等)。
  • 通过Linux的cgroups、procfs、sysfs等机制,直接读取内核提供的资源统计信息。
  • 同时提供一个内置Web界面(默认端口8087),打开就能看到图表!

为什么用cAdvisor?

优点 说明
开箱即用 一条 docker run 命令就能启动,无需复杂配置
完全免费 & 开源 Apache 2.0 协议,GitHub 可查:github.com/google/cadv...
轻量低开销 资源占用小,适合生产环境部署
支持集成 可将数据导出到 Prometheus、InfluxDB 等,配合 Grafana 做高级可视化

举个例子

你运行了三个容器:Web服务、数据库、缓存。

突然系统变卡,但不知道谁在"捣乱"。

只需打开http://你的服务器IP:8087,cAdvisor会立刻显示:

  • 数据库容器内存飙升到95%
  • Web容器磁盘写入异常频繁

问题一目了然,排查效率翻倍!

一句话总结:

cAdvisor是你进入容器可观测性世界的第一把钥匙------简单、免费、有效。

2.安装前提条件

2.1ssh远程连接到飞牛

  • 开启【SSH 服务】
  • 使用终端(Windows PowerShell / Mac Terminal)登录:

在设置--->SSH中开启SSH服务:

2.2验证docker是否开启

使用命令:

lua 复制代码
docker -v 
systemctl status -v

也可以直接在飞牛主页查看(其他机器也是这样的哦~)

3.部署cAdvisor

3.1 安装cAdvisor

首先创建一下安装的目录并进入到该目录:

bash 复制代码
mkdir -p cadvisor
cd cadvisor/

首先使用以下命令启动cAdvisor:

ruby 复制代码
docker run -d --name=cadvisor \
  --privileged \
  --volume=/:/rootfs:ro \
  --volume=/var/run:/var/run:ro \
  --volume=/sys:/sys:ro \
  --volume=/var/lib/docker/:/var/lib/docker:ro \
  --publish=8087:8080 \
  gcr.io/cadvisor/cadvisor:v0.47.0

部署完成后,在浏览器中输入 http://飞牛IP:8087 就能看到cAdvisor的界面:

3.2 使用cAdvisor

访问http://192.168.42.147:8087/containers/地址,在首页可以看到主机的资源使用情况,包含 CPU、内存、文件系统、网络等资源,如下图所示。

访问http://192.168.42.147:8087/docker,这个页面会列出Docker的基本信息和运行的容器情况,如下图所示:

在上图中的Subcontainers下会列出当前主机上运行的所有容器,点击其中一个容器即可查看该容器的详细运行状态,如下图所示:

还有更多的详细信息:

cAdvisor与cpolar结合:远程监控容器性能

cAdvisor是一个强大的容器资源监控工具,但它默认只在本地提供Web UI。如果你希望从外部网络安全地访问cAdvisor的监控界面 (比如在家查看公司服务器上的容器状态),就可以借助cpolar实现内网穿透。

为什么选择cpolar?

特性 说明
简单易用 一条命令即可将本地服务暴露到公网
安全可靠 基于 TLS 加密,支持身份验证和访问控制
免公网 IP / 路由器配置 无需申请固定 IP 或配置端口转发
支持 HTTP / TCP / UDP 完美适配 cAdvisor 的 Web 服务

4.安装cpolar实现随时随地开发

4.1 什么是cpolar?

cpolar是一款安全高效的内网穿透工具,无需公网IP或复杂配置,只需一条命令,即可将本地服务器、Web服务或任意端口映射到公网,让你随时随地远程访问内网应用,特别适合开发调试、远程运维和应急部署等场景。

4.2 部署cpolar

cpolar 可以将你本地电脑中的服务(如 SSH、Web、数据库)映射到公网。即使你在家里或外出时,也可以通过公网地址连接回本地运行的开发环境。

❤️以下是安装cpolar步骤:

使用一键脚本安装命令:

arduino 复制代码
sudo curl https://get.cpolar.sh | sh

安装完成后,执行下方命令查看cpolar服务状态:(如图所示即为正常启动)

lua 复制代码
sudo systemctl status cpolar

Cpolar安装和成功启动服务后,在浏览器上输入虚拟机主机IP加9200端口即:【http://ip:9200】访问Cpolar管理界面,使用Cpolar官网注册的账号登录,登录后即可看到cpolar web 配置界面,接下来在web 界面配置即可:

打开浏览器访问本地9200端口,使用cpolar账户密码登录即可,登录后即可对隧道进行管理。

5.配置公网地址

登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理------创建隧道:

  • 隧道名称:可自定义,本例使用了:cadvisor,注意不要与已有的隧道名称重复
  • 协议:http
  • 本地地址:8087
  • 域名类型:随机域名
  • 地区:选择China Top

创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了公网地址,接下来就可以在其他电脑或者移动端设备(异地)上,使用地址访问。

访问成功。

6.保留固定公网地址

使用cpolar为其配置二级子域名,该地址为固定地址,不会随机变化。首先,访问官网的预留页面(未登录会先跳转到登录页面,登录即可):

arduino 复制代码
https://dashboard.cpolar.com/reserved

如下图所示:

点击左侧的预留,选择保留二级子域名,地区选择china Top,然后设置一个二级子域名名称,我使用的是,大家 cadvisor可以自定义。填写备注信息,点击保留。

登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理------隧道列表,找到所要配置的隧道,点击右侧的编辑

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名
  • 地区: China Top

点击更新

更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。

最后,我们使用固定的公网地址在任意设备的浏览器中访问,可以看到成功访问的页面,这样一个永久不会变化的二级子域名公网网址即设置好了。

总结

服务器莫名其妙变慢,你打开top看了一眼,CPU打满,但进程列表里全是容器名,看不出到底是哪个在折腾你。

磁盘又满了。你删日志、清缓存,结果第二天又满了。还是找不到元凶。

想看看某个容器具体用了多少内存、网络跑了多少流量,打开docker stats,手动刷新,数据一闪而过,没有历史记录,无法对比。

这三个场景但凡中过一条,你就知道这种"容器在跑但看不见"的处境有多难受。不是监控没用,是你没装对东西。

cAdvisor就是来解决这个的。Google开源,一条命令跑起来,本机8087端口直接出Web界面,所有容器CPU、内存、磁盘、网络一目了然,图表都是实时刷新的。

零配置,零门槛,装完立刻有数据。

相关推荐
程序员三明治1 小时前
【AI】Prompt 工程入门:从五要素框架到 RAG 生产级 Prompt 模板与 Java 实战
java·人工智能·后端·大模型·llm·prompt·agent
雨辰AI2 小时前
SpringBoot3 + 人大金仓 V9 全栈日志实战:Logback + Loki + Filebeat 构建统一日志平台
java·数据库·后端·云原生·eureka·logback·政务
石小石Orz2 小时前
OpenAI官方:harness-engineering(工程技术:在智能体优先的世界中利用 Codex)
前端·后端
SamDeepThinking2 小时前
打造高效团队的四个关键动作
java·后端·团队管理
fliter2 小时前
WAF 机器学习推理从 1519μs 压到 275μs,Cloudflare 是怎么做到的
后端
Moment2 小时前
2026年,为什么NestJS + Monorepo越来越流行了 ❓❓❓
前端·后端·面试
IT果果日记2 小时前
人大金仓使用Flink-CDC
大数据·数据库·后端
Gopher_HBo2 小时前
阻塞队列之SynchronousQueue
后端
understandme2 小时前
30 毫秒教会你怎么在 TKE 搭建 Istio
后端