记录skywalking预警如何处理401问题

在使用skywalking进行报警的时候,gateway经常会返回401,此时会产生很多误报和成功率下降的问题,

正确的做法是:推动公司制定统一的 API 响应规范,其实就是代码层面进行修改鉴权失败一律返回200,真正的业务错误码放在 JSON 响应体里。

c 复制代码
// HTTP Status: 200 OK
{
  "code": 401,
  "msg": "登录已超时,请重新登录",
  "data": null
}

无奈小运维人微言轻😄,并且确实看起来没啥实际影响,只能从运维侧这边想办法

目前正在Vibe一个skywalking的屏蔽状态码插件,比较临时的处理方式就是单独给gateway进行一个分组,连续出现低成功率才进行告警,可以大大降低误报概率

c 复制代码
  endpoint_sla_rule:
    expression: sum((endpoint_sla / 100) < 50) >= 3
    include-names-regex: ".* in gateway$"
    period: 5
    silence-period: 10
    message: "接口 {name} 最近5分钟内至少3分钟持续成功率低于50%"
    tags:
      level: WARNING
相关推荐
不懂的浪漫1 天前
OpenTelemetry 和 SkyWalking Agent 怎么选?一次讲清 OTel、SkyWalking Agent 的相同点与区别
wpf·skywalking·链路追踪·opentelemetry·otel
简简单单就是我_hehe4 天前
Webfunny Apm + SkyWalking Agent 全链路监控实战:从集成到问题排查
skywalking
phltxy6 天前
分布式链路追踪实战:Apache SkyWalking 从入门到精通
分布式·apache·skywalking
苍煜9 天前
SkyWalking最新实操入门博客:微服务可观测性搭建+原理详解+从零部署+UI使用教程
ui·微服务·skywalking
KK溜了溜了11 天前
Skywalking
skywalking
雨辰AI11 天前
SpringBoot3 + 人大金仓 V9 微服务监控实战|Prometheus+Grafana+SkyWalking 全链路监控
数据库·后端·微服务·grafana·prometheus·skywalking
随风,奔跑15 天前
Spring Cloud Alibaba(六)-链路追踪SkyWalking
java·后端·spring·skywalking
tsyjjOvO16 天前
分布式事务 Seata 与链路追踪 SkyWalking 全解析
分布式·skywalking
小旭952716 天前
分布式事务 Seata 详解 + 链路追踪 SkyWalking 实战
java·分布式·后端·信息可视化·skywalking
dEso RSET23 天前
Skywalking介绍,Skywalking 9.4 安装,SpringBoot集成Skywalking
spring boot·后端·skywalking