Prometheus主要实现采集、存储、查询设备数据指标、告警等功能;Grafana通过Prometheus的API以仪表板的形展示数据,同时在线提供了大量监测数据展示模版。然而,实际运维中我们不仅需要实时监测数据,还需要了解设备的物理位置、拓扑、链路、业务、配置......,传统方法需要关联查询多个系统或文档才能全面了解设备相关数据。
nVisual 作为可视化运维管理工具,提供了 Prometheus 和 Grafana 所不具备的档案、分析和规划能力。因此,通过集成 Prometheus、Grafana 和 nVisual 三个系统,可以实现统一入口查看所有被监测对象的数据 。这将有助于故障根因分析、快速故障诊断,提升运维服务质量,降低运维成本。
具体解决方案如下:
1 利用grafana集成Prometheu创建监控仪表板模版
关于Prometheu与grafana集成、Grafana制作仪表板,请访问:
https://prometheus.io 和 https://grafana.com
2 在nVisual中将设备类型与Grafana仪表板模版关联
nVisual有一个自定义监控视图的组件,右侧工具栏的"实时监测"按纽 ,这个按纽可以通过后台数据库表:monitor来定义按纽集成的模版视图路径,表定义如下:
3 集成Alertmanager
将Alertmanager告警信息通过webhook推送至nVisual的事件管理,进行告警与数字孪生对象的关联,实现统一告警,配置如下:
4Prometheus与nVisual集成后的效果
当告警发生生,通过告警事件自动关联到机柜设备视图,点击告警设备,右侧工具栏显示设备运行状态实时数据,通过点击不同的右侧工具栏按纽,可以分别查看设备详细视图、自定义属性信息、实时监测数据、拓扑、链路、业务映射......
示例地址
通过链接可访问此在线监测示例:
https://cloud.nvisual.com/share.html?shareLink=W7F78h2zP54mVhIwvNx7&v=1725377215673/?ref=CSDN