网站/接口可用性拨测最佳实践

简介

可用性监测是观测云提供的综合性在线服务监控方案。它通过创建无需编写代码的 API,利用全球分布的监测点模拟真实用户在不同地区和网络环境下的访问体验。这种监测不仅涵盖网络质量、网站性能、关键端点等关键业务场景,还提供了对用户使用体验等多维度性能指标的周期性监控。

应用场景

  • 多协议支持:基于 HTTP、TCP、ICMP、WEBSOCKET 协议创建拨测任务,多方面主动监控在线业务的可用性和性能;
  • 全球网络监控:利用观测云遍布全球的监测点,即时监测网络性能,保障全球服务的可用性和性能表现;
  • 网络站点访问性能分析:从地理纬度和可用性趋势两个方面,分析网络站点的可用性性能;
  • 实时告警通知:基于拨测任务产生的数据配置告警规则,当业务出现异常,会基于规则以邮件、钉钉机器人等方式发送告警通知。

实践步骤

1、创建拨测任务

  • 观测云的「可用性监测」功能中,新建拨测任务,这里以 API 拨测为例。
  • 选择拨测类型,填写目标 URL 和判断条件。
  • 按需选择发送拨测的节点,以及拨测频率,点击保存即可。

2、查看效果

等拨测频率触发后,即可在「可用性监测」的概览和查看器中,即可查看到详细的结果。

3、设置告警监控

当我们希望拨测结果有异常时,能主动告警通知到相关的负责人;我们可以设置监控器来解决这个问题。

3.1 新建可用性数据检测

在观测云的「监控」功能中,新建监控器,选择"可用性数据检测"。

3.2 填写检测配置

按需填写检测频率、检测区间、以及触发的规则。这里表示响应时间大于 100ms 就告警。更多详情,可参考规则配置

3.3 自定义通知内容

观测云支持自定义告警通知的标题和内容,并且可以使用预置的模板变量

3.4 选择告警策略

监控满足触发条件后,支持将告警消息发送给指定的通知对象。通知对象包括但不限于:钉钉机器人、企业微信机器人、飞书机器人、Webhook 自定义、短信组、简单 HTTP 请求、Slack、Teams、电话、IM 消息发送等等

3.5 查看告警结果

告警触发后,相关通知对象就会收到告警信息,以下是钉钉机器人的告警信息:

相关推荐
Sarvartha10 分钟前
三目运算符
linux·服务器·前端
晓晨的博客17 分钟前
ROS1录制的bag包转换为ROS2格式
前端·chrome
Wect25 分钟前
LeetCode 72. 编辑距离:动态规划经典题解
前端·算法·typescript
donecoding38 分钟前
别再让 pnpm 跟着 nvm 跑了!独立安装终极指南
前端·node.js·前端工程化
GISer_Jing40 分钟前
AI全栈转型_TS后端学习路线
前端·人工智能·后端·学习
竹林81840 分钟前
被The Graph的GraphQL查询坑了三天,我用一个真实DeFi项目把链上数据索引彻底搞懂了
前端·graphql
漫游的渔夫40 分钟前
前端开发者做 Agent:别只会执行,用 4 类失败策略让 AI 知道怎么停
前端·人工智能·typescript
用户0595401744643 分钟前
把多级缓存一致性验证从手工测试换成 Pytest 参数化,Bug 排查时间缩短 90%
前端·css
暗不需求44 分钟前
深入理解 LangChain:AI 应用开发框架的工程化实践
前端·langchain
用户059540174461 小时前
把 Redis 持久化测试从 800 行 Shell 换成 30 行 pytest,排错效率翻了 10 倍
前端·css