Kafka从指定时间开始消费数据

需求-故障定位:flink消费kafka数据,某个时间点漏数据

  • 背景:kafka数据保留3天,如果第二天,发现程序异常导致数据丢失,需要定位是topic源头无数据,还是程序处理出现异常。
bash 复制代码
# 1, 设置一个新的group,重置offset为某个时间,格式为'YYYY-MM-DDTHH:mm:SS.sss'
[root@kafka01 ~]# ./bin/kafka-consumer-groups.sh --bootstrap-server kafka01:9092 \
    --group t1 --topic topicTest:2,1,0 --reset-offsets \
    --to-datetime '2024-11-27T00:00:00.000' --execute
GROUP                          TOPIC                  PARTITION  NEW-OFFSET
t1                             topicTest                  2          23227
t1                             topicTest                  1          12819
t1                             topicTest                  0          187
[root@kafka01 ~]#  ./bin/kafka-consumer-groups.sh --bootstrap-server kafka01:9092 \
     --describe --group t1
GROUP           TOPIC      PARTITION  CURRENT-OFFSET  LOG-END-OFFSET  LAG             CONSUMER-ID     HOST            CLIENT-ID
t1              topicTest   2          23227           27151           3924            -               -               -
t1              topicTest   1          12819           14781           1962            -               -               -
t1              topicTest   0          187             187             0               -               -               -


# 2, 使用该group,开始消费数据 (如下演示:消费7条数据,消费offset从 23227 --变为23234 )
[root@kafka01 ~]# ./bin/kafka-console-consumer.sh --bootstrap-server kafka01:9092 \
       --topic topicTest  --group t1 |head -n 2
#.....打印具体日志...
#Unable to write to standard out, closing consumer.
#Processed a total of 7 messages
[root@kafka01 ~]#  ./bin/kafka-consumer-groups.sh --bootstrap-server kafka01:9092 \
      --describe --group t1
GROUP           TOPIC      PARTITION  CURRENT-OFFSET  LOG-END-OFFSET  LAG             CONSUMER-ID     HOST            CLIENT-ID
t1              topicTest   2          23234           27151           3917            -               -               -
t1              topicTest   1          12819           14781           1962            -               -               -
t1              topicTest   0          187             187             0               -               -               -
相关推荐
Cachel wood9 天前
Spark教程6:Spark 底层执行原理详解
大数据·数据库·分布式·计算机网络·spark
找不到、了9 天前
kafka消费的模式及消息积压处理方案
java·kafka
超级小忍9 天前
Spring Boot 集成 Apache Kafka 实战指南
spring boot·kafka·apache
Ting-yu9 天前
零基础学习RabbitMQ(1)--概述
分布式·学习·rabbitmq
寒山李白9 天前
分布式ID生成方式及优缺点详解
数据库·分布式·分布式id生成方式
acrel158215962219 天前
光伏电站 “智慧大脑”:安科瑞 Acrel-1000DP 分布式监控系统技术解析
分布式·分布式光伏·安科瑞电气
Cachel wood10 天前
Spark教程1:Spark基础介绍
大数据·数据库·数据仓库·分布式·计算机网络·spark
沉着的码农10 天前
【分布式】Redisson滑动窗口限流器原理
java·redis·分布式·redisson
小葛呀10 天前
在大数据求职面试中如何回答分布式协调与数据挖掘问题
大数据·分布式·机器学习·面试·数据挖掘·互联网·技术栈
阳光下是个孩子10 天前
基于 Spark 实现 COS 海量数据处理
大数据·分布式·spark