【kafka-01数据保留时间设置】

kafka正确设置过期时间

背景

某天突然发现我的kafka中group_id消费记录不见了,特地查了下咋回事。众所周知新版本的kafka group_id消费的offset记录已经不存储在zookeeper上了,而是存储在__consumer_offsets 这个kafka内部自己管理的topic中,这个topic有50个分区。 毫无疑问估计是group_id offset存储也应该是有时间过期值的,于是专门查了查。

如何正确配置数据过期时间

需要两个参数结合,且最好配置的时间是一样的,下面是例子

java 复制代码
#存储一年
log.retention.hours=8760   ->数据过期时间
offsets.retention.minutes=525600 ->group_id offset的消费位点过期时间。 换算成小时也是一年
相关推荐
m0_564876841 小时前
Distributed data parallel (DDP)分布式训练
分布式
BYSJMG2 小时前
计算机毕设选题推荐:基于Hadoop的交通事故数据可视化分析系统
大数据·vue.js·hadoop·分布式·后端·信息可视化·课程设计
野犬寒鸦3 小时前
从零起步学习并发编程 || 第三章:JMM(Java内存模型)详解及对比剖析
java·服务器·开发语言·分布式·后端·学习·spring
虫小宝4 小时前
查券返利机器人的异步任务调度:Java XXL-Job+Redis实现海量查券请求的分布式任务分发
java·redis·分布式
liux35285 小时前
MySQL -> Canal -> Kafka-> ES 完整数据同步流程详解
mysql·elasticsearch·kafka
yq1982043011566 小时前
构建高可用资源导航平台:基于Django+Scrapy的分布式架构实践
分布式·scrapy·django
Byte Beat6 小时前
使用docker单机部署kafka,以KRaft模式运行,不使用zookeeper,
docker·kafka·kraft
你这个代码我看不懂6 小时前
Kafka常见问题解答
分布式·kafka
Tony Bai6 小时前
Git 即数据库:Beads (bd) —— 专为 AI Agent 打造的分布式任务追踪引擎
数据库·人工智能·分布式·git
小邓睡不饱耶6 小时前
Spark Streaming实时微博热文分析系统:架构设计与深度实现
大数据·分布式·spark