IT运维:使用数据分析平台监控 Linux 节点

监控目标

监控 Linux 服务器的基本信息以及各项性能指标,包括:

  • CPU

  • 内存、Swap

  • 网络

  • 文件系统、磁盘 IO

解决方案

使用 Node exporter 收集硬件以及操作系统内核的指标数据,并通过 HTTP API 提供数据

使用 Vector agent 通过 Node exporter HTTP API 采集数据,并将数据通过 HEI 导入指定的数据集

使用仪表板展示 Linux 节点的状态信息

操作步骤

1、部署 Node exporter [操作步骤]

https://prometheus.io/docs/guides/node-exporter/#installing-and-running-the-node-exporter)

(详细代码请至官网加入鸿鹄技术社区获取)

2、创建数据集 [操作步骤]

https://www.yanhuangdata.com/honghu_manual/docs/data_management/eventset/#创建数据集)

如使用已经存在的数据集,可跳过此步骤

3、创建 HEI endpoint [操作步骤]

https://www.yanhuangdata.com/honghu_manual/docs/gdi/push_based/#新建hei端口接收数据)

如使用已经存在的 HEI endpoint,可跳过此步骤

4、部署 Vector agent 导入数据 [操作步骤]

https://vector.dev/docs/setup/quickstart/)

(详细代码请至官网加入鸿鹄技术社区获取)

5、导入 Linux 主机监控仪表板 [操作步骤]

https://www.yanhuangdata.com/honghu_manual/docs/dashboard/#创建仪表板)

📎linux_node_monitoring.json

(具体内容请至官网加入鸿鹄技术社区获取)

仪表板 Screenshot

Linux 主机监控

后续工作

上述监控方案实现了 Linux 主机指标数据的仪表板展示,后续还将针对关键主机指标数据配置告警功能,提高异常状况出现后的响应速度。

相关推荐
南棱笑笑生1 天前
20251217给飞凌OK3588-C开发板适配Rockchip原厂的Buildroot【linux-5.10】后调通ov5645【只能预览】
linux·c语言·开发语言·rockchip
爬山算法1 天前
Netty(10)Netty的粘包和拆包问题是什么?如何解决它们?
服务器·网络·tcp/ip
Sleepy MargulisItG1 天前
【Linux网络编程】应用层协议:HTTP协议
linux·服务器·网络·http
logic_51 天前
静态路由配置
运维·服务器·网络
G31135422731 天前
Linux 内核设计中的核心思想与架构原则
linux·架构·php
zhuzewennamoamtf1 天前
Linux内核platform抽象、数据结构、内核匹配机制
linux·运维·数据结构
门思科技1 天前
企业级 LoRaWAN 网关远程运维方案对比:VPN 与 NPS FRP 的技术与安全差异分析
运维·网络·安全
云和数据.ChenGuang1 天前
Deepseek 持续迭代的模型
运维·运维技术·数据库运维工程师·运维教程
物联网软硬件开发-轨物科技1 天前
【轨物方案】聚焦锯床设备智能化升级,打造工业互联网新范式
运维·科技·物联网
suzhou_speeder1 天前
企业数字化网络稳定运行与智能化管理解决方案
运维·服务器·网络·交换机·poe·poe交换机