kafka主题(topic)数据保留时间设置

kafka主题(topic)消息清理记录

服务器磁盘试用率超出80%,通过巡检查看是由于kafka的log目录下占用较多,命令查看当前目录下的磁盘试用情况。这样我们就列出当前目录下占用最多的10个文件或目录。

cpp 复制代码
du -ah --max-depth=1 . | sort -hr | head -n 10

比较明显的看出,是kafka主题占用较多,通过去topic中查看发现数据文件保存时间已经超出3个月的时间,但是在kafka下的config/server.properties配置文件中

c 复制代码
log.retention.hours=168

已经配置为了7天。但是没有生效。

怀疑可能是主题在创建是进行过独立设置,于是我们进行排查。

cpp 复制代码
bin/kafka-configs.sh --zookeeper 172.0.0.1:2181 --describe --entity-type topics --entity-name iot_monitor

查看主题保留数据时间,输出内容为。

c 复制代码
Configs for topic 'iot_monitor' are max.message.bytes=5242880,retention.ms=15552000000`

可以看到主题实际的数据过期时间为180 天(≈6 个月) 。

于是我们开始手动设置

c 复制代码
./kafka-configs.sh --zookeeper 172.0.0.1:2181(这里要修改为你实际的zk地址) --alter --entity-type topics --entity-name iot_monitor --add-config retention.ms=604800000

设置完成之后,可以再通过上次执行的命令进行查看。2-3分钟之后,我们再进行查看磁盘空间的大小,以及主题的数据保留时间发现生效了。不过这里的生效只是零时,当重启kafka之后就会失效。

相关推荐
SoleMotive.2 小时前
谢飞机爆笑面经:Java大厂3轮12问真题拆解(Redis穿透/Kafka分区/MCP Agent)
redis·spring cloud·kafka·java面试·mcp
程序猿阿伟3 小时前
《分布式追踪Span-业务标识融合:端到端业务可观测手册》
分布式
爆米花byh3 小时前
在RockyLinux9环境的Kafka4.1.1单机版安装(无ZK依赖)
中间件·kafka
yumgpkpm4 小时前
预测:2026年大数据软件+AI大模型的发展趋势
大数据·人工智能·算法·zookeeper·kafka·开源·cloudera
消失的旧时光-19435 小时前
第十六课实战:分布式锁与限流设计 —— 从原理到可跑 Demo
redis·分布式·缓存
若水不如远方5 小时前
分布式一致性(三):共识的黎明——Quorum 机制与 Basic Paxos
分布式·后端·算法
DemonAvenger5 小时前
Kafka消费者深度剖析:消费组与再平衡原理
性能优化·kafka·消息队列
会算数的⑨6 小时前
Kafka知识点问题驱动式的回顾与复习——(一)
分布式·后端·中间件·kafka
张小凡vip6 小时前
Kafka--使用 Kafka Connect 导入/导出数据
分布式·kafka
回忆是昨天里的海6 小时前
kafka概述
分布式·kafka