Zabbix 监控自动化

一、网络自动发现

部署环境

|---------------|---------|----------------|-----------|---------------------|
| zabbix server | ZBX | 192.168.27.152 | CentOS7.9 | zabbix server 6.4.8 |
| zabbix agent | agent01 | 192.168.27.154 | CentOS7.9 | zabbix agent 6.4.8 |
| zabbix agent | agent02 | 192.168.27.158 | CentOS7.9 | zabbix agent 6.4.8 |

1.搭建LNMP环境

2.安装配置zabbix

3.在agent机器上安装配置(上传软件包)

rpm -ivh pcre2-10.23-2.el7.x86_64.rpm
rpm -ivh zabbix-agent-6.4.8-release2.el7.x86_64.rpm
#修改配置文件
vi /etc/zabbix/zabbix_agentd.conf

Server=192.168.10.108     #修改117行
ServerActive=192.168.10.108        #修改171昂
Hostname=agent01            #修改182行名字:

systemctl start zabbix-agent
systemctl enable zabbix-agent

#监听端口
ss -nlpt | grep 10050

数据采集→自动发现,点击创建发现规则 后,按照下图填写自动发现规则

点击 告警 动作 发现动作 创建发现

添加操作

5:验证

数据采集-->主机

二、网络自动注册

告警-->动作-->自动注册动作,创建动作。

然后点击创建动作,填写名称、触发条件和操作

5:验证

数据采集-->主机

三、主动和被动模式

主被动模式介绍

Agent程序有两种工作模式:主动模式和被动模式

在被动模式下,zabbix-agent监听10050端口,等待zabbix-server服务器的10051端口的监控信息收集请求;

在主动模式下,zabbix-agent收集监控信息并主动将数据传给zabbix-server所在服务器的10051端口

被动模式的缺点

当服务端监控的主机达到一定数量之后,由Server端去收集数据(被动模式),Zabbix会出现严重的性能问题

当被监控端到达一个量级的时候,Web操作很卡,容易出现502

图层断裂

开启的进程(Pollar)太多,即使减少item数量,以后加入一定量的机器也会有问题

优化方式:

添加Proxy节点或者Node模式做分布式监控

调整Agentd为主动模式

主动模式的设置

(1)删除前面创建的自动注册

删除"告警"-->"动作"中刚才创建的自动注册动作

删除"数据采集"-->"主机"中自动注册的主机

(2)在被监控端调整 Agent 为主动模式

[root@server01 ~]# vi /etc/zabbix/zabbix_agentd.conf

#Server=192.168.10.108 #主动模式需要注释掉此行 117行

StartAgents=0 ##为server端的连接开启的进程数,0代表关闭被动模式 142行

[root@server01 ~]# systemctl restart zabbix-agent

查看zabbix agent进程,此时已经没有了agent进程

[root@server01 ~]#ss -nlpt | grep zabbix

备注:

在主动模式下,agent不再监听10050的端口。

(3)添加主机

(4)查看主机添加结果

"数据采集"-->"主机",查看监控到则主机列表

备注:

在主动模式下,"ZBX"不会显示为绿色。

三、Zabbix邮件告警

2 :配置 警媒介

1 设置告警媒介参数

"告警"-->"媒介"-->选择Email

注意:在设置认证时,密码的位置要使用邮箱的授权码,而不是密码,设置完后点击更新,注意要启用Email媒介

最新版qq有加密,所以可以设置为加密认证

2 启用此媒介并测试邮件发送

3:设置用户报警媒介

"用户"-->"用户"-->选Admin,添加用户的报警媒介

4:设置动作

1 添加动作

"告警"-->"动作"-->"触发器动作"-->创建动作

5:测试

相关推荐
MXsoft61814 分钟前
华为服务器(iBMC)硬件监控指标解读
大数据·运维·数据库
19004317 分钟前
linux6:常见命令介绍
linux·运维·服务器
Camellia-Echo24 分钟前
【Linux从青铜到王者】Linux进程间通信(一)——待完善
linux·运维·服务器
嚯——哈哈42 分钟前
轻量云服务器:入门级云计算的最佳选择
运维·服务器·云计算
我是唐青枫44 分钟前
Linux dnf 包管理工具使用教程
linux·运维·服务器
嚯——哈哈1 小时前
从入门到精通:解析如何使用亚马逊云服务器(AWS EC2)
运维·服务器·aws
Elastic 中国社区官方博客2 小时前
Elasticsearch 中的热点以及如何使用 AutoOps 解决它们
大数据·运维·elasticsearch·搜索引擎·全文检索
DC_BLOG2 小时前
Linux-Nginx虚拟主机
linux·运维·nginx
坐公交也用券2 小时前
使用Python3实现Gitee码云自动化发布
运维·gitee·自动化
1900433 小时前
linux复习5:C prog
linux·运维·服务器