分布式开源监控Zabbix实战

Zabbix作为一个分布式开源监控软件,在传统的监控领域有着先天的优势,具备灵活的数据采集、自定义的告警策略、丰富的图表展示以及高可用性和扩展性。本文简要介绍Zabbix的特性、整体架构和工作流程,以及安装部署的过程,并结合实战进行监控配置。


1、Zabbix介绍

Zabbix是一个企业级的分布式开源监控方案,能够监控各种网络参数以及服务器健康性和完整性。它由Alexei Vladishev创建,目前由Zabbix SIA在持续开发和支持。Zabbix基于Web页面,提供分布式系统监控及网络监控功能,提供多种监控方式,支持在复杂系统架构下的全栈监控。

1.1 Zabbix特性

1)监控数据采集的灵活性

Zabbix支持多种数据采集方式,包括自动发现、agent、snmp、JMX、telnet采集方式和主动、被动模式下的数据传输。同时,它还支持用户自定义插件和自定义间隔数据收集。

  • 采集数据源的广泛性:从基础设施、数据库、应用程序、传感器等终端采集数据
  • 数据采集的灵活性:数据采集的间隔、策略,采集数据的类型包括文本、二进制以及结构化JSON、CSV等数据格式
  • 支持代理和无代理监控:利用Zabbix Agent代理进行深度监控;无代理监控支持SNMP、IPMI、ODBC和Prometheus等监控协议
  • 支持采集数据的规范化和转换:对采集数据进行格式转换、验证数据的准确性等

2)告警信息自定义配置

Zabbix可以设置告警信息的周期、级别、恢复通知、时段阈值等,支持维护周期和单机停用。同时支持多条件告警、告警信息推送等。

  • 根据传入的数据流进行异常检测和趋势预测,自定义告警级别和分类
  • 将告警信息推送到不同的平台,支持告警平台、邮箱和通信平台等
  • 故障告警自动修复功能,针对部分场景实现故障自愈功能,如自动重启、自动伸缩资源

3)数据可视化展示

Zabbix可以自定义监控视图、网络拓扑、自定义面板和IT服务时间与可用性。

  • 支持采集数据的个性化展示,实现拖拽缩放、仪表盘、各种图表等功能
  • 支持地理环境和基础设施拓扑展示,展示整个集群的整体情况
  • 生成定制化报表定时发送

4)架构高可用性和扩展性

Zabbix的监控系统对设备的性能要求较低,支持proxy分布式监控、分布式集中管理、自动化监控和开放式接口,扩展性较强。

  • Zabbix高可用部署架构防止数据丢失,并且提高前端用户体验
  • 通过部署Zabbix Proxy支持分布式监控,支持无限的可扩展性

5)安全审计策略保证

Zabbix支持安全用户审计日志、权限认证和用户限制允许维护的列表。

  • Zabbix组件之间的通信通过加密传输,支持不同的加密算法
  • 用户权限定义不同的级别、用户分为不同的角色进行管理
  • 限制采集数据的敏感信息访问等

除了以上特性,Zabbix支持在本地或云平台快速部署和配置、无缝对接不同的软硬件平台、多租户管理等特性。

1.2 Zabbix监控采集方式

Zabbix支持监控各种系统平台,包括Linux和Windows等主流操作系统,也可以借助SNMP或者SSH协议监控路由交换设备。

  • 硬件监控:Zabbix IPMI Interface,通过IPMI接口进行监控,监控被监控对象的物理特征,比如电压、温度、风扇状态、电源状态等。
  • 系统监控:Zabbix Agent Interface,通过专用的代理程序进行监控,易于部署、性能消耗低,推荐首选监控方式。
  • Java监控:Zabbix JMX Interface ,通过JMX(java management extensions)java管理扩展)监控JVM虚拟机。
  • 网络设备监控:Zabbix SNMP Interface,通过SNMP协议与被监控对象进行通信,用于监控路由器、交换机这种网络设备。
  • 应用服务监控:Zabbix Agent UserParameter
  • MySQL数据库监控:percona-monitoring-plulgins
  • URL监控:Zabbix Web监控
1.3 Zabbix和Prometheus监控对比

Prometheus也是时下较为流行的分布式监控工具,Zabbix和其对比,如下表所示:

名称 发布时间 开发语言 性能 社区支持 容器支持 企业使用 部署难度
Zabbix 2012 C+PHP 上限约1w节点 活跃 较差 传统监控如服务器监控上优势明显 多系统不同监控部署方式
Prometheus 2016 Go 以万为单位 活跃 支持云原生、K8S等监控 容器相关监控首选 简单,一条命令搞定

相比较而言,Prometheus对容器监控支持能力更为强大,是云原生和K8S等容器相关监控的首选解决方案;Zabbix作为传统的监控方式,系统稳定成熟度高,对服务器等基础设施监控上具有优势,缺点是随着架构复杂度增加,定制化的难度也更大了。

2、Zabbix架构原理

2.1 Zabbix整体架构

Zabbix的架构分为服务端、Proxy层和客户端部分,主要包括以下部分:

  • Zabbix Server:核心组件,负责收集和接收来自被监控设备的数据,并与Zabbix Agents、Zabbix proxy和Zabbix Database进行通信。
  • Zabbix Database:用于存储Zabbix的数据。
  • Zabbix Agents:安装在被监控服务器上,负责收集本地数据,并将其发送到Zabbix Server。
  • Zabbix Proxy:可选组件,常用于监控节点很多的分布式环境中,代理Server收集部分数据转发到Server,可以减轻Server的压力。
  • Zabbix GUI:Zabbix的Web前端管理界面,用户通过Web前端页面可以查看Zabbix Server收集的数据,也可以对Zabbix Server进行配置。
2.2 Zabbix主要工作进程

在Zabbix中,有以下几个主要的进程:

  • zabbix_agentd:Zabbix客户端守护进程,主要负责收集客户端监控项数据。
  • zabbix_server:Zabbix服务端守护进程,主要负责收集Zabbix客户端数据。
  • zabbix_proxy:Zabbix代理进程,其功能类似于Server,作用上类似与一个中转站,最终会把收集到的数据再次提交给zabbix_server。
  • zabbix_get:一个Zabbix工具,通常运行在zabbix server或者是zabbix proxy上,用于远程获取客户端信息,通常用于排错。
  • zabbix_sender:一个Zabbix工具,通常运行在zabbix客户端,用于耗时比较长的的检查,其作用是主动发送数据。
  • zabbix_java_gateway:Zabbix2.0之后引入的新功能,可以用户JAVA方面的设备,但是其只能主动获取数据,而不能被动获取数据。

此外,还有报警器(alerter)、配置同步器(configuration syncer)、数据发送器(data sender)、数据库watchdog等进程。不同的进程在Zabbix系统中担任不同的角色和任务,可以根据需要灵活配置和扩展。

2.3 Zabbix工作流程

Zabbix通过客户端定期收集监控设备上的数据,并将其发送给zabbix服务端;zabbix服务端将zabbix客户端发送的数据存储的数据库中,zabbix web根据数据在前端进行展示和绘图。Zabbix的数据采集模式主要包括两种:

  • Poller模式(主动轮询):Zabbix Server会主动轮询Zabbix Agent或Zabbix Proxy,获取监控数据。这种方式的好处是可以主动获取数据,数据采集的及时性相对较高,但是缺点是在大量服务器的环境中,Zabbix Server不能及时获取最新的数据。
  • Trapper模式(主动捕捉):Zabbix Agent或Zabbix Proxy主动向Zabbix Server发送数据,这种方式可以在Zabbix Server不主动轮询的情况下获取实时的监控数据,但是缺点是需要在被监控服务器上安装Agent或Proxy,增加了运维成本。
2.4 Zabbix监控框架

Zabbix的部署架构可以根据实际监控环境的需求进行选择和配置,主要有以下三种常见架构:

  • Server-Client架构:最简单的架构,监控设备和被监控设备之间直接相连,Zabbix Server和Zabbix Agent之间直接进行数据交互。适用于网络比较简单,设备比较少的监控环境。
  • Server-Proxy-Client架构:其中Proxy是Server、Client之间沟通的一个桥梁,Proxy本身不存放数据,只是将Agent发来的数据暂时存放,然后再提交给Server。这种架构经常和Master-Node-Client架构做比较,一般适用于跨机房、跨网络的中型网络架构的监控。
  • Master-Node-Client架构:最复杂的监控架构,适用于跨网络、跨机房、设备较多的大型环境。每个Node同时也是一个Server端,Node下面可以接Proxy,也可以直接接Client。

3、Zabbix部署实战

3.1 Zabbix源码安装及部署
3.1.1 部署架构

本次安装部署采用Server-client部署架构,如图所示Server端直接连到代理端。

3.1.2 安装Server端

由于Zabbix 6.0以上版本在Centos 7上不支持Server部署,本次以Zabbix 5.0版本测试。

1)系统环境配置

#1、关闭selinux
动态生效setenforce 0
配置/etc/selinux/config中SELINUX=设置为disabled

#2、关闭防火墙
关闭防火墙# systemctl stop firewalld
#systemctl disable firewalld

#3、准备mysql环境

2)下载安装包仓库

rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
Retrieving https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
warning: /var/tmp/rpm-tmp.eaB8GC: Header V4 RSA/SHA512 Signature, key ID a14fe591: NOKEY
Preparing...                          ################################# [100%]
Updating / installing...
   1:zabbix-release-5.0-1.el7         ################################# [100%]

此时/etc/yum.repos.d/下会有一个zabbix.repo文件

3)安装Server端、mysql数据库和Web前端

#yum install zabbix-server-mysql zabbix-agent -y
Resolving Dependencies
--> Running transaction check
---> Package zabbix-agent.x86_64 0:5.0.36-1.el7 will be installed
---> Package zabbix-server-mysql.x86_64 0:5.0.36-1.el7 will be installed
...
Installed:
  zabbix-agent.x86_64 0:5.0.36-1.el7                                               zabbix-server-mysql.x86_64 0:5.0.36-1.el7                                              
Dependency Installed:
  OpenIPMI.x86_64 0:2.0.27-1.el7         OpenIPMI-libs.x86_64 0:2.0.27-1.el7             OpenIPMI-modalias.x86_64 0:2.0.27-1.el7         fping.x86_64 0:3.16-1.el7        
  libevent.x86_64 0:2.0.21-4.el7         net-snmp-libs.x86_64 1:5.7.2-49.el7_9.2         unixODBC.x86_64 0:2.3.1-14.el7                 
Complete!

4)安装前端软件包

# yum install centos-release-scl -y
#编辑zabbix.repo
[zabbix-frontend]
...
enabled=1
...
#安装前端软件包
yum install zabbix-web-mysql-scl zabbix-apache-conf-scl -y

5)初始化数据库配置

#1、在mysql数据库中创建数据库用户并授权
# mysql -uroot -p -A
mysql> create database zabbix character set utf8 collate utf8_bin;
mysql> create user 'zabbix'@'%' identified with mysql_native_password by 'password';
mysql> grant all privileges on zabbix.* to 'zabbix'@'%';
mysql> set global log_bin_trust_function_creators = 1;
mysql> quit;

#2、导入初始架构和数据
# zcat /usr/share/doc/zabbix-server-mysql*/create.sql.gz | mysql -uzabbix -p zabbix

6)为Zabbix server配置数据库

#编辑配置文件/etc/zabbix/zabbix_server.conf
DBPassword=password

7)为Zabbix配置正确的时区

#编辑配置文件/etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf
php_value[date.timezone] = Asia/Shanghai    #亚洲/上海 

8)启动Zabbix服务并查看

#启动Zabbix server和agent进程,并为它们设置开机自启:
systemctl restart zabbix-server zabbix-agent httpd rh-php72-php-fpm
systemctl enable zabbix-server zabbix-agent httpd rh-php72-php-fpm

查看zabbix服务启动情况

# netstat -nltp |grep zabbix
tcp        0      0 0.0.0.0:10050           0.0.0.0:*               LISTEN      1028/zabbix_agentd  
tcp        0      0 0.0.0.0:10051           0.0.0.0:*               LISTEN      1623/zabbix_server  
tcp6       0      0 :::10050                :::*                    LISTEN      1028/zabbix_agentd  
tcp6       0      0 :::10051                :::*                    LISTEN      1623/zabbix_server

9)异常处理

#1、连接数据库失败,指定的socket有误
#错误信息:connection to database 'zabbix' failed: [2002] Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock'
#解决办法:由于mysql配置的socket和zabbix默认的socket路径不同,修改zabbix配置文件/etc/zabbix/zabbix_server.conf中的DBSocket选项
DBSocket=/tmp/mysql.sock

#2、连接数据库失败,提示加密插件caching_sha2_password.so找不到
#错误信息:cannot be loaded: /usr/lib64/mysql/plugin/caching_sha2_password.so: cannot open shared object file: No such file or directory
#解决办法:在创建用户时指定mysql的加密插件with mysql_native_password
create user 'zabbix'@'%' identified with mysql_native_password by 'password';
3.1.3 配置Web端页面

1)登录Web访问页面http://192.168.112.121/zabbix

2)配置数据库连接

3)输入服务器详细信息

4)完成安装

5)Web界面登录,默认用户是Admin、密码是zabbix

6)修改界面语言为中文

3.1.4 被监控对象安装Agent代理

1)系统环境配置

#1、关闭selinux
动态生效setenforce 0
配置/etc/selinux/config中SELINUX=设置为disabled

#2、关闭防火墙
关闭防火墙# systemctl stop firewalld
#systemctl disable firewalld

2)下载Agent安装包仓库

rpm -Uvh https://repo.zabbix.com/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rp

3)安装zabbix-agent

# yum install zabbix-agent -y

4)修改agent配置文件,指定zabbix server地址

# vi /etc/zabbix/zabbix_agentd.conf
Server=192.168.112.121

5)启动服务并设置开机启动

systemctl start zabbix-agent
systemctl enable zabbix-agent

6)检查zabbix-agent端口状态

# netstat -nltp |grep zabbix
tcp        0      0 0.0.0.0:10050           0.0.0.0:*               LISTEN      1814/zabbix_agentd  
tcp6       0      0 :::10050                :::*                    LISTEN      1814/zabbix_agentd
3.2 Zabbix监控页面配置
3.2.1 添加主机

在"配置->主机"中添加需要监控的主机,并选择监控模板指标

添加完成后,看到主机信息

在监测->主机中,能看到监控数据。同时在仪表盘中能看到当前主机的数量

3.2.2 自定义拓扑图

在"监测->拓扑图"中编辑拓扑图信息,比如添加服务器节点、建立链接关系、网络流量等

链接信息中填上标签"{Zabbix server:net.if.out["ens33"].last(0)}",可以在"主机->配置->监控项"中获得监控信息。

以上是分布式监控Zabbix的特性介绍、架构流程介绍以及安装部署实战,Zabbix功能相当丰富,需要在实际使用过程中再琢磨熟悉。


参考资料:

  1. https://www.zabbix.com/cn/
  2. https://blog.51cto.com/u_16099217/6370557
  3. https://blog.csdn.net/SmileLife_/article/details/126535575
相关推荐
是小崔啊1 小时前
开源轮子 - EasyExcel02(深入实践)
java·开源·excel
vvw&5 小时前
Docker Build 命令详解:在 Ubuntu 上构建 Docker 镜像教程
linux·运维·服务器·ubuntu·docker·容器·开源
weisian1517 小时前
Redis篇--常见问题篇7--缓存一致性2(分布式事务框架Seata)
redis·分布式·缓存
m0_748241707 小时前
前端学习:从零开始做一个前端开源项目
前端·学习·开源
不能只会打代码8 小时前
Java并发编程框架之综合案例—— 分布式日志分析系统(七)
java·开发语言·分布式·java并发框架
Elastic 中国社区官方博客8 小时前
如何通过 Kafka 将数据导入 Elasticsearch
大数据·数据库·分布式·elasticsearch·搜索引擎·kafka·全文检索
马剑威(威哥爱编程)9 小时前
分布式Python计算服务MaxFrame使用心得
开发语言·分布式·python·阿里云
华为云开发者联盟9 小时前
Karmada v1.12 版本发布!单集群应用迁移可维护性增强
云原生·kubernetes·开源·容器编排·karmada
学计算机的睿智大学生9 小时前
Hadoop的生态系统所包含的组件
大数据·hadoop·分布式