概述
这里以负责 Zabbix 的员工离职为例. 实际上这是通用的, 你可以将 Zabbix 替换为任何业务系统, 任何运维工具, 任何其他场景.
为确保Zabbix监控系统平稳过渡,以下是离职员工必须移交的核心工作和资料清单,按优先级分类呈现:
一、基础访问权限移交
- 账户清单
- Zabbix Web控制台管理员账号
- 被监控服务器的SNMP/Agent账号
- 数据库(如MySQL/PostgreSQL)读写权限
- 关联的LDAP/AD集成账号(如有)
- SSH/远程访问权限
- Zabbix服务器/Proxy的SSH密钥或密码
- 跳板机/VPN访问权限(如适用)
二、系统配置文档
- 架构拓扑图
- 标注Zabbix Server/Proxy/Agent分布
- 网络流量走向和关键监控节点
- 配置文件备份
zabbix_server.conf
zabbix_proxy.conf
关键参数说明- 自定义脚本路径(如AlertScripts/ExternalScripts)
- 监控模板
- 导出的XML模板文件(主机模板、应用集、监控项)
- 第三方模板来源(如GitHub/Gitee链接)
三、关键运维流程
- 日常任务清单
- 监控项阈值调整频率(如磁盘空间、CPU告警)
- 定期维护窗口(如数据库Housekeeper清理)
- 告警处理SOP
- 告警分级规则(如P0-P3)
- 通知渠道(邮件/短信/钉钉/企业微信配置)
- 静默规则(如维护期屏蔽告警)
- 灾备恢复指南
- Zabbix数据库备份命令与周期
- 快速重建Zabbix Server的Ansible/Shell脚本
四、数据与集成
- 历史数据
- 数据库大小及保留策略(如趋势数据30天、历史数据7天)
- Grafana集成配置(如数据源ID、仪表盘JSON)
- API与自动化
- 常用API调用示例(如批量添加主机)
- 自动化工具(如Python脚本、Zabbix CLI命令)
五、验证与交接清单
- 测试用例
- 模拟触发一条告警,验证通知链路
- 手动添加一台测试主机,确认自动发现规则生效
- 联系人清单
- 依赖Zabbix数据的团队接口人(如运维/开发/业务部门)
- 供应商支持联系方式(如Zabbix原厂/云服务商)
交接时限建议
- 至少预留2周重叠期 :
第1周:文档审核+权限转移
第2周:实操演练+问题修复 - 至少确保1个月交接期
通过以上步骤,可最大限度降低交接风险。若时间紧迫,优先确保权限、配置文件、告警流程三项移交。
三人行, 必有我师; 知识共享, 天下为公. 本文由东风微鸣技术博客 EWhisper.cn 编写.