
简介
什么是 Vigil?
Vigil是一个现代、轻量级、开源的服务器监控系统,提供对硬盘和SSD的实时S.M.A.R.T.健康状况跟踪。它为速度和简单性而设计,通过现代化的Web仪表盘和预测性健康分析提供对基础设施的即时可见性,以防止硬件故障。它适用于任何Linux系统,包括那些配备了LSI/Broadcom HBA控制器的系统。
主要特点
- 🔥轻量级代理:单个 Go 二进制文件,零依赖,可快速部署在任何服务器上。
- 🐳Docker 服务端 :中央监控中心已容器化,便于使用
Docker或Docker Compose轻松部署。 - ⚡快速的 Web 仪表盘 :现代化的
HTML5/JS界面,提供即时加载和实时更新。 - 🔍深度分析 :允许查看原始
S.M.A.R.T.属性、温度历史和详细的驱动器信息。 - 🤖预测性检查:通过高级分析来判断一个驱动器是即将发生故障还是仅仅是老化。
- 📊持续监控:可配置的报告间隔,并具备自动重新连接能力。
- 🔐身份验证:内置登录系统,保障会话安全。
- 🏷️驱动器别名:用户可以为驱动器设置自定义名称(例如,"Plex Media"、"备份驱动器"),以便于识别。
- 🔧HBA 支持 :自动检测连接在
SAS HBA控制器(如LSI SAS3224)后的SATA驱动器。
应用场景
- 主动式服务器与硬盘监控 :利用
S.M.A.R.T.数据监控硬盘和SSD的健康状况,以预测和防止硬件故障。 - 基础设施可视化 :提供一个集中的
Web仪表盘,用于实时了解多个服务器及其存储设备的状态。 - 家庭实验室与小型服务器环境 :其轻量级代理和便捷的
Docker部署使其非常适合个人服务器、家庭实验室或运行在Linux上的中小型团队基础设施。 - 支持 HBA 控制器的系统 :专为通过
SAS HBA控制器连接的SATA驱动器而设计,这对于其他监控解决方案可能是一个挑战。

Vigil 提供了一个强大而灵活的平台,以便在各种场景中监控和管理服务器和驱动器的健康状态,确保用户不遗漏任何关键的硬件故障。
安装
在群晖上以 Docker 方式安装。
分为 服务端

和 采集端 两个镜像

推荐使用 docker cli 进行安装
服务端
首先要安装一个服务端,作为监控系统的核心,处理来自各个采集端的报告,并提供现代化的网页界面,用户可以实时查看服务器和驱动器的健康状况
bash
# 新建文件夹 vigil 和 子目录
mkdir -p /volume1/docker/vigil/data
# 进入 vigil 目录
cd /volume1/docker/vigil
# 一键启动服务端
docker run -d \
--name vigil-server \
--restart unless-stopped \
-p 9080:9080 \
-v $(pwd)/data:/data \
-e ADMIN_PASS=your-secure-password \
ghcr.io/pineappledr/vigil:latest
# 示例
docker run -d \
--name vigil-server \
--restart unless-stopped \
-p 9080:9080 \
-v vigil_data:/data \
-e ADMIN_PASS=laosu123 \
ghcr.io/pineappledr/vigil:latest
环境变量 ADMIN_PASS 值设为 your-secure-password。用于配置容器应用程序的管理密码信息
采集端
采集端负责从被监控的机器上收集 S.M.A.R.T. 数据和健康状态报告,并将其传输至服务端
采集端可以和服务端在安装在同一台主机,也可以不是

bash
# 一键启动采集端
docker run -d \
--name vigil-agent \
--net=host \
--privileged \
--restart unless-stopped \
-v /dev:/dev \
ghcr.io/pineappledr/vigil-agent:latest \
--server http://YOUR_SERVER_IP:9080 \
--interval 60
# 示例
docker run -d \
--name vigil-agent \
--net=host \
--privileged \
--restart unless-stopped \
-v /dev:/dev \
ghcr.io/pineappledr/vigil-agent:latest \
--server http://192.168.0.197:9080 \
--interval 60
--net=host:使用主机网络模式,这意味着容器将能够访问主机的所有网络接口;--privileged:给予容器更高的权限,允许容器访问主机的设备,且可以执行一些特权操作;-v /dev:/dev:将宿主机的/dev目录映射到容器的/dev目录。这允许容器访问宿主机上的设备文件,从而能够与硬件进行交互;--server http://192.168.0.197:9080:这是传递给容器应用程序的命令行参数,指定--server,也就是服务器的地址。容器将与此服务器进行通信;--interval 60:也是传递给容器应用程序的命令行参数,指定--interval参数,设置为 60 秒。用于定义信息采集操作的时间间隔;
运行
在浏览器中输入 http://<群晖IP>:9080 就能看到登录界面。使用 admin 和您设置的 ADMIN_PASS 登录。

登录成功后,很快就能看到主机信息

更详细的信息

参考文档
pineappledr/vigil: Vigil is a modern, lightweight, and open-source server monitoring system, that provides real-time S.M.A.R.T. health tracking.