玩转 Pipelines 之修正链路错误状态码

Pipelines 是一种运行在 DataKit 上的轻量级脚本语言,用于对采集到的数据进行自定义解析和修改。通过定义解析规则,它们能够将不同种类的数据细粒度地切割并转换为结构化的格式,以满足具体的数据管理需求。例如,用户可以通过 Pipelines 提取日志中的时间戳、状态和其他关键字段,并将这些信息作为标签使用。

DataKit 利用 Pipelines 的强大功能,使得用户能够在工作空间页面上直接编写和调试 Pipeline 脚本,从而实现对数据的更细粒度的结构化处理。这种处理不仅提高了数据的可管理性,而且通过 Pipeline 提供的丰富函数库,支持对常见数据进行标准化操作,如解析时间字符串和补全 IP 地址的地理信息等。

场景分析

用户在上报应用性能监测数据的时候,如果在业务侧做了一些自定义状态码,比如自定义 4xx,但这种在业务上属于正常的心跳监控,不需要在观测云上归类为错误请求。这时候怎么在观测云上进行修正状态码,从而减少错误分析,以及误告警。

实施方案

如下链路原文带有 status=error 的标签,实际用户在 "error_type"="com.xxx.cloud.os.service.exceptions.OsServiceException" 的错误类型下,都属于正常的业务请求,需要从源头把这类型的报错修正为正常的状态。

python 复制代码
{
  "time": 1761533611771,
  "__docid": "T_1761533611771_d3vdtb2c600s73e27rpg",
  "__namespace": "tracing",
  "__source": "user-xxx-eks",
  "cluster_name_k8s": "eks-prod",
  "create_time": 1761533612872,
  "date": 1761533611771,
  "date_ns": 1761533611771449300,
  "dd_version": "1.0.0",
  "dk_fingerprint": "ip-xxx-16-xx-229.us-west-2.xxx.internal",
  "duration": 19712,
  "env": "prod",
  "host": "ip-172xxx-220.us-west-2.xxx.internal",
  "host_ip": "172.16.12.xxx",
  "message": "{"service":"user-xxx-eks","name":"spring.handler","resource":"PointRightPublicController.listGiftCardRight","start":1761533611771449259,"duration":19712571,"error":0,"meta":{"_dd.p.tid":"68fedeab00000000","thread.name":"http-nio-9602-exec-11","language":"jvm","trace_128_bit_id":"68fedeab000000003d47a83b00ad5ef0","component":"spring-web-controller"},"metrics":{"_dd.measured":1,"thread.id":207},"type":"web"}",
  "operation": "spring.handler",
  "parent_id": "6497552948601585817",
  "pod_name": "user-service-xxx-xxx",
  "pod_namespace": "xxx-prod",
  "region": "us-xxx-2",
  "remote_ip": "172.16.xx.xxx",
  "resource": "PointRightPublicController.listGiftCardRight",
  "service": "user-xxx-eks",
  "source": "ddtrace",
  "source_type": "web",
  "span_id": "744311550763894067",
  "span_kind": "server",
  "span_type": "local",
  "start": 1761533611771449,
  "status": "error",
  "time_us": 1761533611771449.2,
  "trace_id": "68fedeab000000003d47a83b00ad5ef0",
  "version": "1.0.0",
  "zone_id": "usw2-xxx",
  "error_type": "com.xxx.cloud.os.service.exceptions.OsServiceException"
}

新建 Pipelines

选择应用性能监控-->服务选择-->一键获取样本

判断如果是 error_type 等于com.xxxxx.cloud.os.service.exceptions.OsServiceException 则为业务自定义错误,这个可以归类为正常请求,无需到错误追踪,把 status 修正为 ok 即可

完整的 Pipelines 规则

lua 复制代码
# 1. 提取 JSON 原始数据中的 "status" 字段(原文为 JSON,用 _ 表示原始输入)
# 语法:json(输入源, JSON路径, 提取后字段名),此处字段名与路径一致(均为 status)
json(_, status, status)

# 2. 判断 status 字段是否等于 "ok"(字符串比较需带双引号)
if status == "error" {
    # 满足条件时,添加新字段 kind,值为 1(整数类型)
  json(_, error_type, error_type)
  if error_type == "com.xxxxx.cloud.os.service.exceptions.OsServiceException" {
  #set_tag(status,"ok")
  add_key(status,"ok")
  }

}

处理结果:

如上演示可看到,误报到错误追踪的链路, 已经修正处理完成,正常在链路列表展示了。

相关推荐
码事漫谈19 分钟前
C++26:开启新纪元
后端
龙卷风04051 小时前
深入理解Spring AI Alibaba多Agent系统:图结构驱动的智能协作
人工智能·后端
用户8356290780511 小时前
C# 高效生成 Word 表格:复杂表格创建实战指南
后端·c#
q***42821 小时前
SpringCloudGateWay
android·前端·后端
我是小妖怪,潇洒又自在1 小时前
springcloud alibaba搭建
后端·spring·spring cloud
回家路上绕了弯1 小时前
支付请求幂等性设计:从原理到落地,杜绝重复扣款
分布式·后端
iOS开发上架哦1 小时前
APP应用上架完整指南:从准备资料到上架流程详解
后端
凌览2 小时前
一键去水印|5 款免费小红书解析工具推荐
前端·javascript·后端
枫叶梨花2 小时前
一次 Kettle 中文乱码写入失败的完整排查实录
数据库·后端