玩转 Pipelines 之修正链路错误状态码

Pipelines 是一种运行在 DataKit 上的轻量级脚本语言,用于对采集到的数据进行自定义解析和修改。通过定义解析规则,它们能够将不同种类的数据细粒度地切割并转换为结构化的格式,以满足具体的数据管理需求。例如,用户可以通过 Pipelines 提取日志中的时间戳、状态和其他关键字段,并将这些信息作为标签使用。

DataKit 利用 Pipelines 的强大功能,使得用户能够在工作空间页面上直接编写和调试 Pipeline 脚本,从而实现对数据的更细粒度的结构化处理。这种处理不仅提高了数据的可管理性,而且通过 Pipeline 提供的丰富函数库,支持对常见数据进行标准化操作,如解析时间字符串和补全 IP 地址的地理信息等。

场景分析

用户在上报应用性能监测数据的时候,如果在业务侧做了一些自定义状态码,比如自定义 4xx,但这种在业务上属于正常的心跳监控,不需要在观测云上归类为错误请求。这时候怎么在观测云上进行修正状态码,从而减少错误分析,以及误告警。

实施方案

如下链路原文带有 status=error 的标签,实际用户在 "error_type"="com.xxx.cloud.os.service.exceptions.OsServiceException" 的错误类型下,都属于正常的业务请求,需要从源头把这类型的报错修正为正常的状态。

python 复制代码
{
  "time": 1761533611771,
  "__docid": "T_1761533611771_d3vdtb2c600s73e27rpg",
  "__namespace": "tracing",
  "__source": "user-xxx-eks",
  "cluster_name_k8s": "eks-prod",
  "create_time": 1761533612872,
  "date": 1761533611771,
  "date_ns": 1761533611771449300,
  "dd_version": "1.0.0",
  "dk_fingerprint": "ip-xxx-16-xx-229.us-west-2.xxx.internal",
  "duration": 19712,
  "env": "prod",
  "host": "ip-172xxx-220.us-west-2.xxx.internal",
  "host_ip": "172.16.12.xxx",
  "message": "{"service":"user-xxx-eks","name":"spring.handler","resource":"PointRightPublicController.listGiftCardRight","start":1761533611771449259,"duration":19712571,"error":0,"meta":{"_dd.p.tid":"68fedeab00000000","thread.name":"http-nio-9602-exec-11","language":"jvm","trace_128_bit_id":"68fedeab000000003d47a83b00ad5ef0","component":"spring-web-controller"},"metrics":{"_dd.measured":1,"thread.id":207},"type":"web"}",
  "operation": "spring.handler",
  "parent_id": "6497552948601585817",
  "pod_name": "user-service-xxx-xxx",
  "pod_namespace": "xxx-prod",
  "region": "us-xxx-2",
  "remote_ip": "172.16.xx.xxx",
  "resource": "PointRightPublicController.listGiftCardRight",
  "service": "user-xxx-eks",
  "source": "ddtrace",
  "source_type": "web",
  "span_id": "744311550763894067",
  "span_kind": "server",
  "span_type": "local",
  "start": 1761533611771449,
  "status": "error",
  "time_us": 1761533611771449.2,
  "trace_id": "68fedeab000000003d47a83b00ad5ef0",
  "version": "1.0.0",
  "zone_id": "usw2-xxx",
  "error_type": "com.xxx.cloud.os.service.exceptions.OsServiceException"
}

新建 Pipelines

选择应用性能监控-->服务选择-->一键获取样本

判断如果是 error_type 等于com.xxxxx.cloud.os.service.exceptions.OsServiceException 则为业务自定义错误,这个可以归类为正常请求,无需到错误追踪,把 status 修正为 ok 即可

完整的 Pipelines 规则

lua 复制代码
# 1. 提取 JSON 原始数据中的 "status" 字段(原文为 JSON,用 _ 表示原始输入)
# 语法:json(输入源, JSON路径, 提取后字段名),此处字段名与路径一致(均为 status)
json(_, status, status)

# 2. 判断 status 字段是否等于 "ok"(字符串比较需带双引号)
if status == "error" {
    # 满足条件时,添加新字段 kind,值为 1(整数类型)
  json(_, error_type, error_type)
  if error_type == "com.xxxxx.cloud.os.service.exceptions.OsServiceException" {
  #set_tag(status,"ok")
  add_key(status,"ok")
  }

}

处理结果:

如上演示可看到,误报到错误追踪的链路, 已经修正处理完成,正常在链路列表展示了。

相关推荐
qq_12498707536 分钟前
重庆三峡学院图书资料管理系统设计与实现(源码+论文+部署+安装)
java·spring boot·后端·mysql·spring·毕业设计
桦说编程18 分钟前
并发编程高级技巧:运行时检测死锁,告别死锁焦虑
java·后端·性能优化
无限大641 分钟前
为什么"软件测试"很重要?——从 Bug 到高质量软件的保障
后端
健康平安的活着1 小时前
springboot+sse的实现案例
java·spring boot·后端
程序员鱼皮1 小时前
从夯到拉,锐评 28 个后端技术!
后端·计算机·程序员·开发·编程经验
开心猴爷2 小时前
混合开发的 App 怎么测试?
后端
俞凡2 小时前
eBPF + OpenTelemetry:适用于任何应用的零代码自动化测量
后端
Cache技术分享2 小时前
275. Java Stream API - flatMap 操作:展开一对多的关系,拉平你的流!
前端·后端
sino爱学习2 小时前
别再踩 Stream 的坑了!Java 函数式编程安全指南
java·后端