Kafka topic消息被自动删除 排查

问题发现

kafka下游消费的开发说没有消息,刚触发消息,按理说应该不会消失才对。
通过Eagle监控发现消息的offset没了

然后到kafka log目录,查看log发现有删除日志

查看了消费者组,只有一个消费者组消费,咨询了开发,确认没有进行消息删除操作

问题排查

查看kafka关于日志保留策略 、消息清理的机制

Kafka的日志清除策略

Kafka中每一个分区partition都对应一个日志文件,而日志文件又可以分为多个日志分段文件,这样也便于日志的清理操作。

Kafka提供了两种日志清除策略:
(1)日志删除(Log Deletion) 按照一定的保留策略来直接删除不符合条件的日志分段。
(2)日志压缩(Log Compaction) 针对每个消息的key进行整合,对于有相同key的不同value值,只保留最后一个版本。

在kafka server.propertie 中通过broker端 的参数log.cleanup.policy 来设置日志的清除策略,此参数的默认值是"delete" ,即采用日志删除的清除的策略。如果要采用日志压缩的清除策略,则需要将log.cleanup.policy设置为"compact",并且还需要将log.cleaner.enable(默认值为true)设定为true

通过将log.cleanup.policy设置为"delete,compact",可以同时支持日志删除和日志压缩两种清除策略。

bash 复制代码
#  设置保留时间为 7 天(默认 168小时)
log.retention.hours=168
# 每个日志分区的最大大小,超过后 Kafka 会删除最早的日志。
log.retention.bytes=1073741824 

# 日志删除的清除策略
log.cleanup.policy=delete

Broke端查看目前没有问题,会不会是Topic对应设置了参数,覆盖了Broke的参数。查看Topic端的对应参数设置

bash 复制代码
kafka-topics.sh --bootstrap-server <broker-list> --describe --topic <your-topic-name>

发现topic的config中有:

bash 复制代码
Topic: ASS_DEFAULT_DEV  TopicId: ZtQctrQrRc6YQHk3PsXWTQ PartitionCount: 8       ReplicationFactor: 2   
Configs: cleanup.policy=delete,retention.ms=1000

配置解释:
cleanup.policy=delete

这意味着 Kafka 会根据 retention.ms 或 retention.bytes 配置来删除过期的消息。默认情况下,cleanup.policy 设置为 delete,这表示 Kafka 会定期删除日志文件中的过期数据。

retention.ms=1000

这表示 Kafka 中该 Topic 的消息会在 1000 毫秒(即 1 秒)后过期,超时的消息会被删除。这是一个非常短的保留时间,意味着数据几乎立刻就会被删除。因此,Topic 中的消息可能在非常短的时间内就会被清理掉。

解决方案

更正 retention.ms 配置:

bash 复制代码
# 将保留时间设置为 7 天
kafka-configs.sh --bootstrap-server 10.20.243.19:9092 --entity-type topics --entity-name ASS_DEFAULT_DEV --alter --add-config retention.ms=604800000

或者删除该属性

bash 复制代码
kafka-configs.sh --bootstrap-server <broker> --entity-type topics --entity-name ASS_DEFAULT_DEV --alter --delete-config cleanup.policy --delete-config retention.ms

再次查看topic,属性已经没了,消息保留时间也正常了

相关推荐
qq_12498707536 小时前
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
ask_baidu6 小时前
KafkaUtils
kafka·bigdata
洛豳枭薰8 小时前
消息队列关键问题描述
kafka·rabbitmq·rocketmq
lucky67078 小时前
Spring Boot集成Kafka:最佳实践与详细指南
spring boot·kafka·linq
Coder_Boy_8 小时前
基于Spring AI的分布式在线考试系统-事件处理架构实现方案
人工智能·spring boot·分布式·spring
袁煦丞 cpolar内网穿透实验室10 小时前
远程调试内网 Kafka 不再求运维!cpolar 内网穿透实验室第 791 个成功挑战
运维·分布式·kafka·远程工作·内网穿透·cpolar
岁岁种桃花儿10 小时前
CentOS7 彻底卸载所有JDK/JRE + 重新安装JDK8(实操完整版,解决kafka/jps报错)
java·开发语言·kafka
人间打气筒(Ada)10 小时前
GlusterFS实现KVM高可用及热迁移
分布式·虚拟化·kvm·高可用·glusterfs·热迁移
xu_yule10 小时前
Redis存储(15)Redis的应用_分布式锁_Lua脚本/Redlock算法
数据库·redis·分布式
難釋懷14 小时前
分布式锁的原子性问题
分布式