IT运维:使用数据分析平台监控 Linux 节点

监控目标

监控 Linux 服务器的基本信息以及各项性能指标,包括:

  • CPU

  • 内存、Swap

  • 网络

  • 文件系统、磁盘 IO

解决方案

使用 Node exporter 收集硬件以及操作系统内核的指标数据,并通过 HTTP API 提供数据

使用 Vector agent 通过 Node exporter HTTP API 采集数据,并将数据通过 HEI 导入指定的数据集

使用仪表板展示 Linux 节点的状态信息

操作步骤

1、部署 Node exporter [操作步骤]

https://prometheus.io/docs/guides/node-exporter/#installing-and-running-the-node-exporter)

(详细代码请至官网加入鸿鹄技术社区获取)

2、创建数据集 [操作步骤]

https://www.yanhuangdata.com/honghu_manual/docs/data_management/eventset/#创建数据集)

如使用已经存在的数据集,可跳过此步骤

3、创建 HEI endpoint [操作步骤]

https://www.yanhuangdata.com/honghu_manual/docs/gdi/push_based/#新建hei端口接收数据)

如使用已经存在的 HEI endpoint,可跳过此步骤

4、部署 Vector agent 导入数据 [操作步骤]

https://vector.dev/docs/setup/quickstart/)

(详细代码请至官网加入鸿鹄技术社区获取)

5、导入 Linux 主机监控仪表板 [操作步骤]

https://www.yanhuangdata.com/honghu_manual/docs/dashboard/#创建仪表板)

📎linux_node_monitoring.json

(具体内容请至官网加入鸿鹄技术社区获取)

仪表板 Screenshot

Linux 主机监控

后续工作

上述监控方案实现了 Linux 主机指标数据的仪表板展示,后续还将针对关键主机指标数据配置告警功能,提高异常状况出现后的响应速度。

相关推荐
Eternal-Student10 分钟前
预处理、编译、汇编、链接
linux·汇编·windows
sp_wxf1 小时前
Stream流
linux·服务器·windows
LYK_HAHA1 小时前
centos常用知识和命令
linux·运维·centos
PythonFun2 小时前
自建RustDesk服务器:详细步骤与操作指南
运维·服务器
Android技术栈2 小时前
鸿蒙开发(NEXT/API 12)【管理应用与Wear Engine服务的连接状态】手机侧应用开发
服务器·harmonyos·鸿蒙·鸿蒙系统·openharmony
可涵不会debug2 小时前
【Linux】信号知识三把斧——信号的产生、保存和处理
linux·运维·信号
笑的像个child2 小时前
使用树莓派搭建音乐服务器
服务器·树莓派·navidrome
facaixxx20242 小时前
京东云主机怎么用?使用京东云服务器建网站(图文教程)
运维·服务器·京东云
jyan_敬言2 小时前
【Linux】Linux命令与操作详解(一)文件管理(文件命令)、用户与用户组管理(创建、删除用户/组)
linux·运维·服务器·c语言·开发语言·汇编·c++
速盾cdn2 小时前
速盾:网页游戏部署高防服务器有什么优势?
服务器·前端·web安全