腾讯mini项目-【指标监控服务重构】2023-08-01

今日已办

合并 Traefik 和 Profile 的 Trace

Traceparent Header 理解有误

Trace Context (w3.org)

故需要解析 TraceHeader 才能获取trace_id、parent_id

go 复制代码
func (profileCtx *ProfileContext) UnpackKafkaMessage(ctx context.Context) (needBreak bool, tpsStatus string, contextErr error) {
	var traceID trace.TraceID
	var parentID trace.SpanID
	headers := profileCtx.msg.Headers
	for _, h := range headers {
		key := h.Key
		value := string(h.Value)
		if key == "Traceparent" {
            // eg: 00-4bf92f3577b34da6a3ce929d0e0e4736-00f067aa0ba902b7-01
			split := strings.Split(value, "-")
			traceID, _ = trace.TraceIDFromHex(split[1])
			parentID, _ = trace.SpanIDFromHex(split[2])
			break
		}
	}
	log.Logger.Info("[UnpackKafkaItem] parse header traceparent",
		zap.String("traceId", traceID.String()),
		zap.String("parentID", parentID.String()),
	)
	//otel.GetTextMapPropagator().Extract(profileCtx.Ctx, header)
	ctx = trace.ContextWithRemoteSpanContext(ctx,
		trace.NewSpanContext(trace.SpanContextConfig{
			TraceID: traceID,
		}))
	var span trace.Span
	profileCtx.Ctx, span = consumerTracer.Start(ctx, "UnpackKafkaMessage")
	//profileCtx.Ctx, span = consumerTracer.Start(profileCtx.Ctx, "UnpackKafkaMessage")
	defer span.End()
	// ...
	return
}

调研上下文传递 Propagator

参考 passthrough

Venus 服务中初始化 TextMapPropagator

go 复制代码
func initPassthroughGlobals() {
	// We explicitly DO NOT set the global TracerProvider using otel.SetTracerProvider().
	// The unset TracerProvider returns a "non-recording" span, but still passes through context.
	log.Logger().Info("Register a global TextMapPropagator, but do not register a global TracerProvider to be in \"passthrough\" mode.")
	log.Logger().Info("The \"passthrough\" mode propagates the TraceContext and Baggage, but does not record spans.")
	otel.SetTextMapPropagator(propagation.NewCompositeTextMapPropagator(propagation.TraceContext{}, propagation.Baggage{}))
}

再根据 Fiber 的 Context 和 Header 来解包出 Context ,创建 Span

go 复制代码
var (
	traceparent    string
	producerTracer = otel.Tracer("venus-producer",
		trace.WithInstrumentationAttributes(attribute.String("venus.work", "producer")))
)

func SplitAndValidate(c *fiber.Ctx) error {
	traceparent = c.Get("Traceparent", "default")
	log.Logger().Info("Traceparent", zap.Any("Traceparent", traceparent))
	log.Logger().Debug("split and validate", zap.String("client", c.IP()), zap.String("agent", string(c.Context().UserAgent())))
	header := make(propagation.HeaderCarrier)
	for k, v := range c.GetReqHeaders() {
		header.Set(k, v)
	}
	otel.SetTextMapPropagator(propagation.NewCompositeTextMapPropagator(propagation.TraceContext{}, propagation.Baggage{}))
	ctx := otel.GetTextMapPropagator().Extract(c.Context(), header)
	_, span := producerTracer.Start(ctx, "SplitAndValidate")
	defer span.End()
	// ...
	return c.Next()
}

Venus中注入,ctx 为 Kafka 的 WriteMessages 的,携带 TraceParentHeader

【感觉没有必要,确实我移除这部分代码正常运行】

  1. 因为 kafka 没有上下文机制,是使用 header 来传播 TraceParent
  2. TraceParent 包含了 trace-id、parent-id共4个字段
  3. Extract方法应该可以根据这个TraceParent的值来解析出tracespan的关系

以相同的方式在 Profile 中处理,关于traceID、parentID的代码就可以移除了

现在的 venus 和 profile 是同一级,是因为 traefik 传播的 traceparent 没有修改,parent-id 是相同的,应该需要 venus 将最后一个 span 的 span_id 更新到 traceparent 的 parent-id 的部分,然后再用 kafka 的 header 传播下来

明日待办

  1. 组长会议汇报进度和问题
相关推荐
homelook8 小时前
【论文解读】可重构电池短路与最短路径分析
重构
桐秋廿8 小时前
【光学仿真】02:PSI Algorithm:基于Fringe索引的Zernike拟合全流程——从干涉图仿真到波前重构
重构
bigdata-rookie14 小时前
StarRocks(2.5.1)vs Clickhouse(21.7.3.14)集群 SSB 性能测试
clickhouse
CTO Plus技术服务中14 小时前
ClickHouse原理解析与应用实践教程
clickhouse
啊汉1 天前
古文观芷App搜索方案深度解析:打造极致性能的古文搜索引擎
go·软件随想
言無咎1 天前
从规则引擎到任务规划:AI Agent 重构跨境财税复杂账务处理体系
大数据·人工智能·python·重构
程序猿阿伟1 天前
《非暴力通关的深度策略与挑战重构手册》
重构
asaotomo2 天前
一款 AI 驱动的新一代安全运维代理 —— DeepSentry(深哨)
运维·人工智能·安全·ai·go
中國龍在廣州2 天前
AI时代“新BAT”正在崛起
大数据·人工智能·深度学习·重构·机器人
码界奇点2 天前
基于Gin与GORM的若依后台管理系统设计与实现
论文阅读·go·毕业设计·gin·源代码管理