目录

kafka中的数据清理策略

Kafka 中的数据清理策略主要用于控制数据的保留时间和存储空间,确保系统不会因为数据积累过多而影响性能。Kafka 提供了两种主要的数据清理策略:

1、基于时间的清理策略:

  • 配置参数:log.retention.hours 或 log.retention.ms
  • 工作原理:Kafka 会根据配置的时间阈值自动删除超过该时间的消息。
  • 示例:如果设置 log.retention.hours=72,则 Kafka 会删除超过72小时的消息。

2、基于大小的清理策略:

  • 配置参数:log.retention.bytes
  • 工作原理:Kafka 会根据配置的存储空间阈值自动删除最早的消息,以确保每个分区的总大小不超过设定的值。
  • 示例:如果设置 log.retention.bytes=1073741824,则 Kafka 会确保每个分区的总大小不超过1GB,超出部分的最早消息将被删除。

Kafka的消息存储在磁盘中,为了控制磁盘占用空间,Kafka需要不断地对过去的一些消息进行清理工作。Kafka的每个分区都有很多的日志文件,这样也是为了方便进行日志的清理。在Kafka中,提供两种日志清理方式:

  • 日志删除(Log Deletion):按照指定的策略直接删除 不符合条件的日志。
  • 日志压缩(Log Compaction):按照消息的key进行整合,有相同key的但有不同value值,只保留最后一个版本。
本文是转载文章,点击查看原文
如有侵权,请联系 xyy@jishuzhan.net 删除
相关推荐
zeijiershuai2 分钟前
MySQL-SQL-DQL语句、DQL基本查询、DQL条件查询、DQL分组查询、聚合函数、DQL排序查询、DQL分页查询
数据库·sql·mysql
橙子家40 分钟前
Redis 集群实现分布式缓存的示例操作流程【Redis 系列之五】
数据库
Jodie_Rao1 小时前
在 M1 芯片的 Mac 电脑上安装 Redis 可以通过 Homebrew 快速完成
数据库·redis·macos
weixin_409411021 小时前
面向数据库场景的大模型交互微调数据集
数据库·oracle·交互
东宇科技2 小时前
mysql中my.cnf权限不能过大。否则无法生效
数据库·mysql
Determined_man3 小时前
Mybatis-plus queryWrapper的使用
数据结构·数据库
飞奔的屎壳郎3 小时前
flink部署使用(flink-connector-jdbc)连接达梦数据库并写入读取数据
大数据·数据库·flink
字节源流3 小时前
【RabbitMQ】延迟队列
分布式·rabbitmq
Databend3 小时前
Databend Cloud 如何给游戏行业数据分析带来 10 倍收益提升?
数据库
喆星时瑜3 小时前
MySQL【8.0.41版】安装详细教程--无需手动配置环境
数据库·mysql·安装教程