Zabbix实现网络响应超时监控

一、简介

在IT运维管理过程中,网络响应超时是比较常见的故障之一。尽管网络响应超时的原因多种多样,解决方案各不相同,但归根结底解决故障的首要前提是发现问题。

在网络超时监控方面,Zabbix能够实时捕获并响应网络设备的超时事件,提供及时的告警通知。通过对超时对象的监控,系统管理员可以迅速识别潜在的网络问题,采取有效的措施以确保网络的稳定性和可用性。

二、配置

1、将以下脚本上传至Agent自定义脚本路径下

#!/bin/bash

#Role:统计Zabbix日志里网络超时的详细清单

#时间范围,输入"1"代表统计前一个小时到现在时间点的网络超时清单

timeRange=$1

#Zabbix日志绝对路径

logFile=$2

startTime=(date -d "-timeRange hour"+%Y%m%d:%H%M)

timeoutList=(grep 'wait for 15 seconds' logFile | grep "startTime"\| grep -v 'name"'\| awk -F'host''{print 2}'| awk '{print 1}' \| awk '{a\[0]++}END{for(i in a){print i,a[i] | "sort -r -k 2"}}')

判断$timeoutList是否为空

if[-n "$timeoutList"];then

如果非空,则打印$timeoutList的值

echo "$timeoutList"

else

如果为空,则打印NULL

echo "NULL"

fi

2、修改所属用户、用户组并赋予脚本执行权限

chmod +x network_error_list.sh

chown itops: network_error_list.sh

ll | grep network_error_list.sh

3、编辑zabbix_agentd文件,添加自定义监控项

vim /itops/zabbix/etc/zabbix_agentd.conf

添加以下内容:

UserParameter=network_error_list[*],/itops/zabbix/scripts/zabbix_self_monitor/network_error_list.sh 1 2

4、重启zabbix_agentd服务

service zabbix_agentd restart

5、打开WEB页面,按下图内容在模板侧添加监控项

添加宏值

6、将模板链接至监控主机后,观察最新数据

探索技术无限可能,博主具有丰富监控模板资源及开发能力和项目管理经验,欢迎添加交流一起探讨,解决你的技术难题!

微信号:king_songax

相关推荐
REDcker18 小时前
Linux disown命令详解 后台作业脱管与终端退出
linux·运维·chrome
cyber_两只龙宝18 小时前
【Oracle】Oracle之SQL的转换函数和条件表达式
linux·运维·数据库·sql·云原生·oracle
被摘下的星星19 小时前
四层模型TCP/IP协议栈
运维·服务器·网络
努力努力再努力wz19 小时前
【Linux网络系列】深入理解 I/O 多路复用:从 select 痛点到 poll 高并发服务器落地,基于 Poll、智能指针与非阻塞 I/O与线程池手写一个高性能 HTTP 服务器!(附源码)
java·linux·运维·服务器·c语言·c++·python
努力努力再努力wz19 小时前
【Linux网络系列】万字硬核解析网络层核心:IP协议到IP 分片重组、NAT技术及 RIP/OSPF 动态路由全景
java·linux·运维·服务器·数据结构·c++·python
.千余19 小时前
【Linux】基本指令2
linux·运维·服务器
2601_9498158419 小时前
Linux下PostgreSQL-12.0安装部署详细步骤
linux·运维·postgresql
minji...19 小时前
Linux 线程同步与互斥(四) POSIX信号量,基于环形队列的生产者消费者模型
linux·运维·服务器·c语言·开发语言·c++
SPC的存折19 小时前
8、Docker镜像瘦身
运维·docker·容器
抠脚学代码19 小时前
Linux开发-->驱动开发-->字符设备驱动框架(2)
linux·运维·驱动开发