文章目录
- [1. zabbix-proxy的分布式监控的概述](#1. zabbix-proxy的分布式监控的概述)
-
- [1.1 分布式监控的主要作用](#1.1 分布式监控的主要作用)
- [1.2 监控数据流向](#1.2 监控数据流向)
- [1.3 构成组件](#1.3 构成组件)
-
- [1.3.1 zabbix-server](#1.3.1 zabbix-server)
- [1.3.2 Database](#1.3.2 Database)
- [1.3.3 zabbix-proxy](#1.3.3 zabbix-proxy)
- [1.3.4 zabbix-agent](#1.3.4 zabbix-agent)
- [1.3.5 web 界面](#1.3.5 web 界面)
- [2. 部署zabbix代理服务器](#2. 部署zabbix代理服务器)
-
- [2.1 前置准备](#2.1 前置准备)
- [2.2 配置 zabbix 的下载源,安装 zabbix-proxy](#2.2 配置 zabbix 的下载源,安装 zabbix-proxy)
- [2.3 部署数据库并导入zabbix相关文件](#2.3 部署数据库并导入zabbix相关文件)
- [2.4 编辑zabbix-proxy的配置文件并启动服务](#2.4 编辑zabbix-proxy的配置文件并启动服务)
- [2.5 在所有主机上配置 hosts 解析](#2.5 在所有主机上配置 hosts 解析)
- [2.6 在 Web 页面配置 agent 代理](#2.6 在 Web 页面配置 agent 代理)
- [2.7 在客户端修改 agent2 配置文件](#2.7 在客户端修改 agent2 配置文件)
- [2.8 在 Web 页面添加客户端主机](#2.8 在 Web 页面添加客户端主机)
- [2.9 分别在客户端和代理服务器上重启服务](#2.9 分别在客户端和代理服务器上重启服务)
- [2.10 在代理服务器查看日志](#2.10 在代理服务器查看日志)
- [3. 部署 Zabbix 高可用集群](#3. 部署 Zabbix 高可用集群)
-
- [3.1 前置准备](#3.1 前置准备)
- [3.2 服务端配置](#3.2 服务端配置)
-
- [3.2.1 配置主节点 zabbix-server](#3.2.1 配置主节点 zabbix-server)
- [3.2.2 配置备节点 Zabbix Server](#3.2.2 配置备节点 Zabbix Server)
- [3.2.3 主备节点添加监控主机](#3.2.3 主备节点添加监控主机)
- [3.2.4 查看高可用集群状态](#3.2.4 查看高可用集群状态)
- [3.3 配置客户端](#3.3 配置客户端)
-
- [3.3.1 修改agent01和agent02的配置文件](#3.3.1 修改agent01和agent02的配置文件)
- [3.3.2 查看Web页面](#3.3.2 查看Web页面)
- [4. 故障切换测试](#4. 故障切换测试)
-
- [4.1 模拟server01节点出现故障,观察Web前端页面](#4.1 模拟server01节点出现故障,观察Web前端页面)
- [4.2 观察是否成功故障切换](#4.2 观察是否成功故障切换)
1. zabbix-proxy的分布式监控的概述
1.1 分布式监控的主要作用
-
分担 server 的集中式压力;
-
解决多机房之间的网络延时问题。
1.2 监控数据流向
1.3 构成组件
1.3.1 zabbix-server
整个监控体系中最核心的组件,它负责接收客户端发送的报告信息,所有配置、 统计数据及操作数据都由它组织。
1.3.2 Database
所有配置信息和zabbix收集到的数据都存储在数据库中。
1.3.3 zabbix-proxy
用于分布式系统中,可以代理zabbix-serve
r的功能,减轻server的压力。
1.3.4 zabbix-agent
客户端软件,装在被监控主机上,用于采集监控数据,并把采集到的的数据发送给proxy或者server。
1.3.5 web 界面
web界面可以让用户随时随地都能够轻松的访问到zabbix,是zabbix-server
的一部分,通常跟server运行在同一台物理机上
2. 部署zabbix代理服务器
2.1 前置准备
bash
zabbix-server 192.168.67.100
zabbix-agent01 192.168.67.101
zabbix-agent02 192.168.67.102
zabbix-proxy 192.168.67.103
bash
systemctl stop firewalld
setenforce 0
2.2 配置 zabbix 的下载源,安装 zabbix-proxy
bash
rpm -ivh https://repo.zabbix.com/zabbix/6.0/rhel/7/x86_64/zabbix-release-6.0-4.el7.noarch.rpm
sed -i 's#https://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo
yum install -y zabbix-proxy-mysql zabbix-sql-scripts zabbix-selinux-policy
2.3 部署数据库并导入zabbix相关文件
bash
#配置 Mariadb yum源
cat > /etc/yum.repos.d/mariadb.repo << EOF
[mariadb]
name = MariaDB
baseurl = http://mirrors.aliyun.com/mariadb/yum/10.5/centos7-amd64/
gpgkey = http://mirrors.aliyun.com/mariadb/yum/RPM-GPG-KEY-MariaDB
gpgcheck = 1
enabled=1
EOF
#安装mariaDB
yum install -y mariadb-server mariadb
#启动
systemctl enable --now mariadb
bash
#初始化数据库
mysql_secure_installation
分别输入 回车 -> n -> Y (设置root密码,如abc123) -> 后面一路 Y
mysql -u root -pabc123
sql
#创建数据库并指定字符集
create database zabbix_proxy character set utf8 collate utf8_bin;
#创建 zabbix 数据库用户并授权
grant all on zabbix_proxy.* to 'zabbix'@'localhost' identified by 'zabbix';
grant all on zabbix_proxy.* to 'zabbix'@'%' identified by 'zabbix';
flush privileges;
#刷新权限
bash
#导入数据库信息
rpm -ql zabbix-sql-scripts #查询 sql 文件的位置
cat /usr/share/zabbix-sql-scripts/mysql/proxy.sql | mysql -uroot -pabc123 zabbix_proxy
2.4 编辑zabbix-proxy的配置文件并启动服务
bash
#修改 zabbix-proxy 配置文件
vim /etc/zabbix/zabbix_proxy.conf
#修改以下项
Server=192.168.67.100 #32行,指定 zabbix 服务端的 IP 地址
Hostname=zbx-proxy #42行,指定当前 zabbix 代理服务器的主机名
DBPassword=zabbix #194行,指定当前数据库 zabbix 用户的密码
bash
#启动 zabbix-proxy
systemctl enable zabbix-proxy --now;systemctl status zabbix-proxy
2.5 在所有主机上配置 hosts 解析
bash
cat > /etc/hosts << EOF
192.168.67.100 zbx-server
192.168.67.101 zbx-agent01
192.168.67.102 zbx-agent02
192.168.67.103 zbx-proxy
EOF
2.6 在 Web 页面配置 agent 代理
bash
点击左边菜单栏【配置】中的【动作】,勾选自动注册规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
bash
点击左边菜单栏【管理】中的【agent代理程序】,点击【创建代理】
【agent代理程序名称】输入 zbx-proxy
【系统代理程序模式】选择 主动式
【代理地址】输入 192.168.67.103
点击 【添加】
2.7 在客户端修改 agent2 配置文件
bash
#更改所有客户端
vim /etc/zabbix/zabbix_agent2.conf
......
Server=192.168.67.103 #80行,指定 zabbix 代理服务器的 IP 地址
ServerActive=192.168.67.103:10051 #120行,指定 zabbix 代理服务器的 IP 地址
2.8 在 Web 页面添加客户端主机
bash
#zbx-agent01
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】输入 zbx-agent01
【可见的名称】输入 zbx-agent01
【模板】搜索 Linux ,选择 Linux by Zabbix agent
【群组】选择 Linux server
【Interfaces】选择 客户端,【IP地址】输入 192.168.2.102,【端口】输入 10050
【由agent代理程序监测】选择 zbx-proxy
点击 【添加】
2.9 分别在客户端和代理服务器上重启服务
bash
systemctl restart zabbix-agent2
systemctl restart zabbix-proxy
bash
等待一段时间后,点击左边菜单栏【配置】中的【主机】刷新,查看客户端主机监控状态正常
2.10 在代理服务器查看日志
bash
tail -f /var/log/zabbix/zabbix_proxy.log
3. 部署 Zabbix 高可用集群
3.1 前置准备
bash
zabbix-server01 192.168.67.100
zabbix-server02 192.168.67.103
zabbix-agent01 192.168.2.101
zabbix-agent02 192.168.2.102
3.2 服务端配置
zabbix-server01
和zabbix-server02
都要部署zabbix服务端,详情见Zabbix监控系统详解1 :zabbix服务部署、自定义监控项、自动发现与自动注册
默认情况下,HA 是关闭的。
HA 部分的配置在配置文件的最下面:High availability cluster parameters 部分
。
3.2.1 配置主节点 zabbix-server
bash
#主节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.67.100
DBName=zabbix
DBUser=zabbix
DBPassword=zabbix
......
HANodeName=zbx-server01 #设置为当前节点主机名
NodeAddress=192.168.67.100:10051 #设置为节点IP
systemctl restart zabbix-server
bash
#主节点给数据库授权远程登录权限
mysql -uroot -pabc123
sql
GRANT all ON zabbix.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
FLUSH PRIVILEGES;
3.2.2 配置备节点 Zabbix Server
bash
#备节点 Zabbix Server 配置
vim /etc/zabbix/zabbix_server.conf
......
DBHost=192.168.67.103 #87
DBName=zabbix #99
DBUser=zabbix #115
DBPassword=zabbix #123
......
HANodeName=zbx-server02
NodeAddress=192.168.67.103:10051
bash
systemctl restart zabbix-server
3.2.3 主备节点添加监控主机
主备配置文件基本相同,以下以主服务器为例
bash
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
bash
【主机名称】输入 zbx-agent01
【可见的名称】输入 zbx-agent01-192.168.67.101
【模板】搜索 Linux ,选择 Linux by Zabbix agent
【群组】选择 Linux servers
【Interfaces】点击添加 客户端
【IP地址】输入 192.168.67.101
3.2.4 查看高可用集群状态
bash
打开Web页面
选择报表-->系统信息
查看高可用集群项是否已经启用
3.3 配置客户端
3.3.1 修改agent01和agent02的配置文件
需要在agent配置文件中将所有的Server节点地址配置到Server和ServerActive中
bash
vim /etc/zabbix/zabbix_agent2.conf
......
Server=192.168.67.100,192.168.67.101,192.168.67.102,192.168.67.103
ServerActive=192.168.67.100;192.168.67.101;192.168.67.102;192.168.67.103
#注意,ServerActive 的连接符是';' ,而不是','
bash
systemctl restart zabbix-agent2.service
3.3.2 查看Web页面
4. 故障切换测试
当zabbix监控主服务器挂掉时,观察能否自动故障切换
4.1 模拟server01节点出现故障,观察Web前端页面
bash
#切换到zabbix-server01
systemctl stop zabbix-server
4.2 观察是否成功故障切换