简介
可用性监测是观测云提供的综合性在线服务监控方案。它通过创建无需编写代码的 API,利用全球分布的监测点模拟真实用户在不同地区和网络环境下的访问体验。这种监测不仅涵盖网络质量、网站性能、关键端点等关键业务场景,还提供了对用户使用体验等多维度性能指标的周期性监控。

应用场景
- 多协议支持:基于 HTTP、TCP、ICMP、WEBSOCKET 协议创建拨测任务,多方面主动监控在线业务的可用性和性能;
- 全球网络监控:利用观测云遍布全球的监测点,即时监测网络性能,保障全球服务的可用性和性能表现;
- 网络站点访问性能分析:从地理纬度和可用性趋势两个方面,分析网络站点的可用性性能;
- 实时告警通知:基于拨测任务产生的数据配置告警规则,当业务出现异常,会基于规则以邮件、钉钉机器人等方式发送告警通知。
实践步骤
1、创建拨测任务
- 在观测云的「可用性监测」功能中,新建拨测任务,这里以 API 拨测为例。

- 选择拨测类型,填写目标 URL 和判断条件。

- 按需选择发送拨测的节点,以及拨测频率,点击保存即可。

2、查看效果
等拨测频率触发后,即可在「可用性监测」的概览和查看器中,即可查看到详细的结果。


3、设置告警监控
当我们希望拨测结果有异常时,能主动告警通知到相关的负责人;我们可以设置监控器来解决这个问题。
3.1 新建可用性数据检测
在观测云的「监控」功能中,新建监控器,选择"可用性数据检测"。

3.2 填写检测配置
按需填写检测频率、检测区间、以及触发的规则。这里表示响应时间大于 100ms 就告警。更多详情,可参考规则配置。

3.3 自定义通知内容
观测云支持自定义告警通知的标题和内容,并且可以使用预置的模板变量。

3.4 选择告警策略
监控满足触发条件后,支持将告警消息发送给指定的通知对象。通知对象包括但不限于:钉钉机器人、企业微信机器人、飞书机器人、Webhook 自定义、短信组、简单 HTTP 请求、Slack、Teams、电话、IM 消息发送等等

3.5 查看告警结果
告警触发后,相关通知对象就会收到告警信息,以下是钉钉机器人的告警信息:
