kafka组件traceId增强

问题背景

kafka 组件在排查生产者和消费者问题的时候,经常出现日志不匹配的情况,为了解决这个问题,本文实现 traceId 在kafka 组件的生产者和消费者之间传递,达到日志匹配,快速排查问题目的。

实现方案

1、新增生产者拦截器,读取 MDC 中的 traceId 并放入 kafka 消息的 headers 中;

2、新增消费者拦截器,读取 kafka 消息 headers 中的 traceId,覆写 MDC 的 traceId。

新增两个拦截器的方案对代码几乎没有侵入性,很优雅的解决了我们的问题。

生产者拦截器

1、kafka 消息发送前,进入到生产者拦截器,如果 MDC.get("trace_id") 存在值,则读取当前 MDC 中的 traceId 并放入消息的 headers 中;

2、如果 MDC.get("trace_id") 不存在,则生成一个 traceId,并写入消息的 headers 中。

java 复制代码
import lombok.extern.slf4j.Slf4j;
import org.apache.kafka.clients.producer.ProducerInterceptor;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.clients.producer.RecordMetadata;
import org.apache.kafka.common.header.Header;
import org.slf4j.MDC;
import org.springframework.stereotype.Component;

import java.nio.charset.StandardCharsets;
import java.util.Map;
import java.util.Optional;
import java.util.UUID;

@Slf4j
@Component
public class KafkaTraceIdProducerInterceptor implements ProducerInterceptor<Integer, String> {

    public static final String TRACE_ID = "trace_id";
    @Override
    public ProducerRecord<Integer, String> onSend(ProducerRecord<Integer, String> producerRecord) {
        producerRecord.headers()
                .add(new Header() {
                    @Override
                    public String key() {
                        return TRACE_ID;
                    }

                    @Override
                    public byte[] value() {
                        return getOrGenerateTraceId()
                                .getBytes(StandardCharsets.UTF_8);
                    }
                });
        return producerRecord;
    }

    @Override
    public void onAcknowledgement(RecordMetadata metadata, Exception exception) {
    }

    @Override
    public void close() {
    }

    @Override
    public void configure(Map<String, ?> configs) {
    }

    /**
     * 获取当前请求TraceId或生成新的traceId
     *
     * @return traceId
     */
    public static String getOrGenerateTraceId() {
        return Optional.ofNullable(MDC.get(TRACE_ID))
                .orElseGet(UUID.randomUUID()::toString);
    }
}

消费者拦截器

读取消息 headers 中的 traceId,覆写 MDC 的 traceId,消息消费完成后清理相关的 MDC。

java 复制代码
import lombok.extern.slf4j.Slf4j;
import org.apache.kafka.clients.consumer.Consumer;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.common.header.Header;
import org.slf4j.MDC;
import org.springframework.kafka.listener.RecordInterceptor;
import org.springframework.stereotype.Component;

import java.nio.charset.StandardCharsets;
import java.util.UUID;

@Slf4j
@Component
public class KafkaConsumerInterceptor<K, V> implements RecordInterceptor<K, V> {

    private final static String TRACE_ID = "trace_id";


    @Override
    public ConsumerRecord<K, V> intercept(ConsumerRecord<K, V> consumerRecord) {
        return consumerRecord;
    }

    @Override
    public ConsumerRecord<K, V> intercept(ConsumerRecord<K, V> record, Consumer<K, V> consumer) {
        try {
            Header traceHeader = record.headers().lastHeader(TRACE_ID);
            String traceId = (traceHeader != null && traceHeader.value() != null)
                    ? new String(traceHeader.value(), StandardCharsets.UTF_8)
                    : UUID.randomUUID().toString();
            MDC.put(TRACE_ID, traceId);
        } catch (Exception e) {
            log.error("处理Kafka消息头异常", e);
        }
        return record;
    }

    @Override
    public void success(ConsumerRecord<K, V> record, Consumer<K, V> consumer) {
        MDC.clear();
    }

    @Override
    public void failure(ConsumerRecord<K, V> record, Exception exception, Consumer<K, V> consumer) {
        MDC.clear();
    }

}

问题延伸

如果遇到需要打印生产者和消费者接口日志或者遇到安全问题,生产者消息加密,消费者消息解密,都可以通过上述增加生产者拦截器和消费者拦截器来解决问题。

相关推荐
南方的狮子先生6 小时前
【C++】C++文件读写
java·开发语言·数据结构·c++·算法·1024程序员节
Neil今天也要学习11 小时前
永磁同步电机无速度算法--基于三阶LESO的反电动势观测器
算法·1024程序员节
开开心心_Every20 小时前
专业视频修复软件,简单操作效果好
学习·elasticsearch·pdf·excel·音视频·memcache·1024程序员节
liu****2 天前
16.udp_socket(三)
linux·开发语言·数据结构·c++·1024程序员节
草莓熊Lotso2 天前
《算法闯关指南:优选算法--位运算》--38.消失的两个数字
服务器·c++·算法·1024程序员节
unable code3 天前
攻防世界-Misc-can_has_stdio?
网络安全·ctf·misc·1024程序员节
思茂信息3 天前
CST License(Flexnet)设置与问题处理方法
服务器·网络·单片机·3d·php·1024程序员节·cst
2301_797892833 天前
论文阅读:《Hypergraph Motif Representation Learning》
论文阅读·1024程序员节
CoderYanger3 天前
前端基础——CSS练习项目:百度热榜实现
开发语言·前端·css·百度·html·1024程序员节
liu****3 天前
13.POSIX信号量
linux·开发语言·c++·算法·1024程序员节