记录skywalking预警如何处理401问题

在使用skywalking进行报警的时候,gateway经常会返回401,此时会产生很多误报和成功率下降的问题,

正确的做法是:推动公司制定统一的 API 响应规范,其实就是代码层面进行修改鉴权失败一律返回200,真正的业务错误码放在 JSON 响应体里。

c 复制代码
// HTTP Status: 200 OK
{
  "code": 401,
  "msg": "登录已超时,请重新登录",
  "data": null
}

无奈小运维人微言轻😄,并且确实看起来没啥实际影响,只能从运维侧这边想办法

目前正在Vibe一个skywalking的屏蔽状态码插件,比较临时的处理方式就是单独给gateway进行一个分组,连续出现低成功率才进行告警,可以大大降低误报概率

c 复制代码
  endpoint_sla_rule:
    expression: sum((endpoint_sla / 100) < 50) >= 3
    include-names-regex: ".* in gateway$"
    period: 5
    silence-period: 10
    message: "接口 {name} 最近5分钟内至少3分钟持续成功率低于50%"
    tags:
      level: WARNING
相关推荐
SoulRoar.7 小时前
Armbian离线安装ES+SkyWalking并注册系统服务
大数据·elasticsearch·skywalking
@土豆1 天前
Java JVM参数环境变量详解及SkyWalking Agent集成技术文档
java·jvm·skywalking
NCIN EXPE1 天前
SpringBoot教程(三十二) SpringBoot集成Skywalking链路跟踪
spring boot·后端·skywalking
enjoy编程1 天前
SkyWalking 分布式追踪、APM学习-I
skywalking
Jinkxs5 天前
SkyWalking - Python 应用追踪:基于 skywalking-python 的埋点
开发语言·python·skywalking
xiaohe076 天前
SpringBoot教程(三十二) SpringBoot集成Skywalking链路跟踪
spring boot·后端·skywalking
代码的奴隶(艾伦·耶格尔)7 天前
SkyWalking链路追踪安装和使用
skywalking
Darkdreams10 天前
分布式监控Skywalking安装及使用教程(保姆级教程)
分布式·skywalking
zhglhy15 天前
Apache SkyWalking分布式链路实现
分布式·apache·skywalking