kafka主题(topic)数据保留时间设置

kafka主题(topic)消息清理记录

服务器磁盘试用率超出80%,通过巡检查看是由于kafka的log目录下占用较多,命令查看当前目录下的磁盘试用情况。这样我们就列出当前目录下占用最多的10个文件或目录。

cpp 复制代码
du -ah --max-depth=1 . | sort -hr | head -n 10

比较明显的看出,是kafka主题占用较多,通过去topic中查看发现数据文件保存时间已经超出3个月的时间,但是在kafka下的config/server.properties配置文件中

c 复制代码
log.retention.hours=168

已经配置为了7天。但是没有生效。

怀疑可能是主题在创建是进行过独立设置,于是我们进行排查。

cpp 复制代码
bin/kafka-configs.sh --zookeeper 172.0.0.1:2181 --describe --entity-type topics --entity-name iot_monitor

查看主题保留数据时间,输出内容为。

c 复制代码
Configs for topic 'iot_monitor' are max.message.bytes=5242880,retention.ms=15552000000`

可以看到主题实际的数据过期时间为180 天(≈6 个月) 。

于是我们开始手动设置

c 复制代码
./kafka-configs.sh --zookeeper 172.0.0.1:2181(这里要修改为你实际的zk地址) --alter --entity-type topics --entity-name iot_monitor --add-config retention.ms=604800000

设置完成之后,可以再通过上次执行的命令进行查看。2-3分钟之后,我们再进行查看磁盘空间的大小,以及主题的数据保留时间发现生效了。不过这里的生效只是零时,当重启kafka之后就会失效。

相关推荐
BUTCHER59 小时前
Filebeat输出Kafka配置
分布式·kafka
CryptoRzz9 小时前
如何高效接入日本股市实时数据?StockTV API 对接实战指南
java·python·kafka·区块链·状态模式·百度小程序
Jackeyzhe10 小时前
从零学习Kafka:集群架构和基本概念
kafka
Jinkxs12 小时前
基于 Java 的消息队列选型年度总结:RabbitMQ、RocketMQ、Kafka 实战对比
java·kafka·java-rocketmq·java-rabbitmq
测试人社区-浩辰14 小时前
AI与区块链结合的测试验证方法
大数据·人工智能·分布式·后端·opencv·自动化·区块链
老友@16 小时前
分布式事务完全演进链:从单体事务到 TCC 、Saga 与最终一致性
分布式·后端·系统架构·事务·数据一致性
jiayong2319 小时前
MQ基础概念面试题
java·kafka·rabbitmq·rocketmq
【赫兹威客】浩哥19 小时前
【赫兹威客】完全分布式ZooKeeper测试教程
分布式·zookeeper·云原生
一晌小贪欢19 小时前
Python 魔术方法实战:深度解析 Queue 模块的模块化设计与实现
开发语言·分布式·爬虫·python·python爬虫·爬虫分布式
【赫兹威客】浩哥19 小时前
【赫兹威客】伪分布式Flink测试教程
大数据·分布式·flink