kafka:消费者从指定时间的偏移开始消费(二)

我的前一篇博客《kafka:AdminClient获取指定主题的所有消费者的消费偏移(一)》为了忽略忽略掉上线之前的所有消息,从获取指定主题的所有消费者的消费偏移并计算出最大偏移来解决此问题。

但这个方案需要使用不常用的AdminClient类,而且如果该主题如果是第一次被消费者拉取消息时,因为得不到消费者的消费偏移,最后的结果,就是从0偏移开始拉取所有消息。并不能真正实现忽略上线之前所有消息的目的。

所以我又优化了方案。基本的原理就是使用KafkaConsumer.offsetsForTimes方法获取消费者的所有主题分区的指定时间的偏移,并将这个偏移作为消费开始的偏移(KafkaConsumer.seek方法) 。

java 复制代码
	@Test
	public void test3SeekToTime() {
		// 配置Kafka消费者的属性
		Properties props = new Properties();
		props.put("bootstrap.servers", "localhost:9092");
		props.put("group.id", "my_consumer_group");
		props.put("key.deserializer", StringDeserializer.class.getName());
		props.put("value.deserializer", StringDeserializer.class.getName());
		// 创建Kafka消费者实例
		try(Consumer<String, String> consumer = new KafkaConsumer<>(props)){			
			boolean seek = false;
			/** 
			 * 循环开始的时间,
			 * 忽略该时间之前的消息
			 */
			long startMills = System.currentTimeMillis();
			while (true) {
				try {
					ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(4000));
					if(!seek) {
						if(!records.isEmpty()) {
							/** 
							 * 获取第一批消息时更新消息偏移到循环开始的时间
							 */
							consumer.offsetsForTimes(Maps.asMap(consumer.assignment(),t->startMills)).forEach((k,v)->{
								if(null != v) {
									System.out.println("seek %s to %s",k,v.offset());
									consumer.seek(k,v.offset());
								}
							});
							seek = true;
						}
						/** 跳过第一批获取到的消息,继续循环 */
						continue;
					}
					records.forEach(record -> {
						String value = record.value();
						System.out.println("Received message: " + value);
					});
				}catch (Exception e) {
					e.printStackTrace();
				}
			}
		}
	}
相关推荐
陈王卜4 分钟前
django+boostrap实现发布博客权限控制
java·前端·django
小码的头发丝、4 分钟前
Spring Boot 注解
java·spring boot
java亮小白19979 分钟前
Spring循环依赖如何解决的?
java·后端·spring
飞滕人生TYF15 分钟前
java Queue 详解
java·队列
武子康37 分钟前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs
武子康39 分钟前
大数据-231 离线数仓 - DWS 层、ADS 层的创建 Hive 执行脚本
java·大数据·数据仓库·hive·hadoop·mysql
苏-言1 小时前
Spring IOC实战指南:从零到一的构建过程
java·数据库·spring
界面开发小八哥1 小时前
更高效的Java 23开发,IntelliJ IDEA助力全面升级
java·开发语言·ide·intellij-idea·开发工具
草莓base1 小时前
【手写一个spring】spring源码的简单实现--容器启动
java·后端·spring
Mephisto.java1 小时前
【大数据学习 | Spark】Spark的改变分区的算子
大数据·elasticsearch·oracle·spark·kafka·memcache