kafka:消费者从指定时间的偏移开始消费(二)

我的前一篇博客《kafka:AdminClient获取指定主题的所有消费者的消费偏移(一)》为了忽略忽略掉上线之前的所有消息,从获取指定主题的所有消费者的消费偏移并计算出最大偏移来解决此问题。

但这个方案需要使用不常用的AdminClient类,而且如果该主题如果是第一次被消费者拉取消息时,因为得不到消费者的消费偏移,最后的结果,就是从0偏移开始拉取所有消息。并不能真正实现忽略上线之前所有消息的目的。

所以我又优化了方案。基本的原理就是使用KafkaConsumer.offsetsForTimes方法获取消费者的所有主题分区的指定时间的偏移,并将这个偏移作为消费开始的偏移(KafkaConsumer.seek方法) 。

java 复制代码
	@Test
	public void test3SeekToTime() {
		// 配置Kafka消费者的属性
		Properties props = new Properties();
		props.put("bootstrap.servers", "localhost:9092");
		props.put("group.id", "my_consumer_group");
		props.put("key.deserializer", StringDeserializer.class.getName());
		props.put("value.deserializer", StringDeserializer.class.getName());
		// 创建Kafka消费者实例
		try(Consumer<String, String> consumer = new KafkaConsumer<>(props)){			
			boolean seek = false;
			/** 
			 * 循环开始的时间,
			 * 忽略该时间之前的消息
			 */
			long startMills = System.currentTimeMillis();
			while (true) {
				try {
					ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(4000));
					if(!seek) {
						if(!records.isEmpty()) {
							/** 
							 * 获取第一批消息时更新消息偏移到循环开始的时间
							 */
							consumer.offsetsForTimes(Maps.asMap(consumer.assignment(),t->startMills)).forEach((k,v)->{
								if(null != v) {
									System.out.println("seek %s to %s",k,v.offset());
									consumer.seek(k,v.offset());
								}
							});
							seek = true;
						}
						/** 跳过第一批获取到的消息,继续循环 */
						continue;
					}
					records.forEach(record -> {
						String value = record.value();
						System.out.println("Received message: " + value);
					});
				}catch (Exception e) {
					e.printStackTrace();
				}
			}
		}
	}
相关推荐
卡尔特斯3 小时前
Android Kotlin 项目代理配置【详细步骤(可选)】
android·java·kotlin
白鲸开源3 小时前
Ubuntu 22 下 DolphinScheduler 3.x 伪集群部署实录
java·ubuntu·开源
ytadpole3 小时前
Java 25 新特性 更简洁、更高效、更现代
java·后端
纪莫3 小时前
A公司一面:类加载的过程是怎么样的? 双亲委派的优点和缺点? 产生fullGC的情况有哪些? spring的动态代理有哪些?区别是什么? 如何排查CPU使用率过高?
java·java面试⑧股
JavaGuide4 小时前
JDK 25(长期支持版) 发布,新特性解读!
java·后端
用户3721574261354 小时前
Java 轻松批量替换 Word 文档文字内容
java
白鲸开源4 小时前
教你数分钟内创建并运行一个 DolphinScheduler Workflow!
java
Java中文社群5 小时前
有点意思!Java8后最有用新特性排行榜!
java·后端·面试
涛哥开发笔记5 小时前
Kakfa核心概念和架构
kafka
代码匠心5 小时前
从零开始学Flink:数据源
java·大数据·后端·flink