大数据-70 Kafka 日志清理:删除、压缩及混合模式最佳实践

点一下关注吧!!!非常感谢!!持续更新!!!

🚀 AI篇持续更新中!(长期更新)

AI炼丹日志-31- 千呼万唤始出来 GPT-5 发布!"快的模型 + 深度思考模型 + 实时路由",持续打造实用AI工具指南!📐🤖

💻 Java篇正式开启!(300篇)

目前2025年08月11日更新到: Java-94 深入浅出 MySQL EXPLAIN详解:索引分析与查询优化详解 MyBatis 已完结,Spring 已完结,Nginx已完结,Tomcat已完结,分布式服务正在更新!深入浅出助你打牢基础!

📊 大数据板块已完成多项干货更新(300篇):

包括 Hadoop、Hive、Kafka、Flink、ClickHouse、Elasticsearch 等二十余项核心组件,覆盖离线+实时数仓全栈! 大数据-278 Spark MLib - 基础介绍 机器学习算法 梯度提升树 GBDT案例 详解

章节内容

上节我们完成了如下内容:

  • 日志索引文件
  • 查看物理存储、查看详细的索引文件
  • 消息偏移
  • 偏移量的存储

日志清理

Kafka提供两种主要的日志清理策略,用于管理磁盘空间和提高存储效率:

1. 日志删除策略 (Delete)

日志删除策略会按照预定的删除规则,移除不再需要保留的数据。主要有以下几种删除方式:

  • 基于时间:删除早于指定时间阈值的消息(默认168小时/7天) 示例配置:log.retention.hours=168

  • 基于大小:当分区日志文件超过指定大小时触发删除 示例配置:log.retention.bytes=1073741824 (1GB)

  • 基于起始偏移量:保留最新的N条消息

应用场景:适用于临时数据存储,如事件流、日志收集等不需要长期保存的数据。

2. 日志压缩策略 (Compact)

日志压缩策略针对消息的Key进行优化存储:

  • 只保留每个Key的最新Value
  • 删除旧版本的同Key消息
  • 保留所有Key的最新快照

应用场景:适用于需要维护最新状态的数据,如:

  • 数据库变更捕获
  • 配置更新
  • 用户会话信息

配置参数

全局配置参数:

properties 复制代码
log.cleanup.policy=delete  # 默认值,可选delete/compact/both

主题级别配置(优先级高于全局配置):

properties 复制代码
cleanup.policy=compact

混合模式配置(同时使用两种策略):

properties 复制代码
cleanup.policy=delete,compact

注意事项

  1. 压缩策略需要消息有明确的Key
  2. 删除策略更节省CPU资源
  3. 压缩策略会保留墓碑消息(key=null)一段时间
  4. 两种策略可以同时使用,但需要谨慎配置

实际应用中,应根据业务需求和数据特性选择合适的清理策略。

日志删除

基于时间

日志删除任务会根据 log.retention.hours / log.retention.minutes / log.retention.ms 设定日志保留的时间节点。如果超过该设定值,就需要进行删除。默认是7天,log.retention.ms 优先级最高。

Kafka依据日志分段中最大的时间戳进行定位。首先要查询日志分段所对应的时间戳文件,查找时间索引文件中最后一个索引项,若最后一条索引项的时间戳字段大于0,则取该值,否则取最近修改时间。

为什么不直接选最近修改时间?

因为日志文件可以有意无意的被修改,并不能真实的反应日志分段的最大时间消息。

删除过程

  • 从日志对象中所维护日志分段的跳跃表中移除待删除的日志分段,保证没有现成对这些日志分段进行读取操作。
  • 这些日志分段上所有文件添加上 .delete 后缀。
  • 交由一个 delete-file 命名的延迟任务来删除这些 .delete 为后缀的文件,延迟执行时间可以通过 file.delete.delay.ms 进行设置。

如果活跃日志分段中存在需要删除的数据?

  • Kafka会切分出一个新的日志分段作为活跃的日志分段,该日志分段不删除,删除原来的日志分段。
  • 先腾出地方,再删除。

基于日志大小

日志删除任务会检查当前日志的大小是否超过设定值,设定项为:log.retention.bytes。单个日志分段的大小由 log.segement.bytes 进行设定。

删除过程

  • 计算需要被删除的日志总大小(当前日志大小(所有分段)减去retention值)
  • 从日志文件第一个LogSegment开始查找可删除的日志分段的文件集合
  • 执行删除

基于偏移量

根据日志分段的下一个日志分段的起始偏移量是否大于等于日志文件的起始偏移量,若是,则可以删除日志分段。

删除过程

  • 从头开始遍历每个日志分段,日志分段1的下一个日志分段的起始偏移量为21,小于LogStartOffset,将日志分段1加入到删除队列中
  • 日志分段2的下一个日志分段的起始偏移量35,小于LogStartOffset,将日志分段2加入到删除队列中
  • 日志分段3的下一个日志分段的起始偏移量57,小于LogStartOffset,将日志分段3加入到删除队列中
  • 日志分段4的下一个日志分段的起始偏移量71,大于LogStartOffset,则不进行删除。

日志压缩

基础概念

日志压缩(Log Compaction)是Apache Kafka提供的一种核心数据保留机制,它通过对消息日志进行智能压缩,提供了比传统时间保留策略更细粒度的数据管理方式。

工作机制

  1. Key-Value存储模型

    • Kafka将每条消息视为一个键值对(Key-Value Pair)
    • 键(Key)用于标识消息的唯一性
    • 值(Value)包含实际的消息内容
  2. 压缩过程

    • Kafka会定期扫描主题分区中的消息
    • 对于具有相同Key的消息,只保留最新版本(offset最大的那条)
    • 旧版本的消息会被标记为可删除
    • 在适当的时机(如后台压缩线程运行时),这些旧消息会被物理删除
  3. 压缩触发条件

    • 当分区大小达到配置的阈值时
    • 按照配置的时间间隔定期执行
    • 通过管理API手动触发

与时间保留策略的区别

特性 日志压缩 时间保留
保留依据 消息Key 时间戳
保留粒度 消息级别 分区级别
数据连续性 保证Key的最新状态 可能丢失最近数据

典型应用场景

  1. 变更数据捕获(CDC)

    • 数据库表变更跟踪
    • 每个表行的主键作为Kafka消息Key
    • 只保留每行的最新状态
  2. 配置管理

    • 系统配置项的更新
    • 配置ID作为Key
    • 确保始终获取最新配置
  3. 状态存储

    • 用户会话状态维护
    • 用户ID作为Key
    • 高效存储最新用户状态

配置示例

properties 复制代码
# 启用日志压缩
log.cleanup.policy=compact

# 触发压缩的阈值(消息数量)
log.cleaner.min.compaction.lag.ms=0

# 压缩检查频率
log.cleaner.backoff.ms=15000

注意事项

  1. 压缩后的日志仍然保持有序性
  2. 删除的消息(null值)会被特殊处理
  3. 活跃段(active segment)不会被压缩
  4. 需要考虑压缩过程对系统性能的影响

应用场景

日志压缩特性在实时计算系统中,特别是在异常容灾方面具有重要的应用价值。以下是几个典型的使用场景:

  1. Spark/Flink实时计算场景

    • 在流处理作业中,系统通常需要在内存中维护状态数据,例如:
      • 滑动窗口聚合结果(如过去24小时的交易总额)
      • 用户会话状态(如在线用户的最近操作记录)
      • 机器学习模型的中间参数
    • 这些状态数据可能是通过持续处理数小时甚至数天的日志流计算得出的
  2. 容灾恢复机制

    • 当系统遇到以下故障时:

      • 节点内存溢出(OOM)
      • 网络分区导致状态丢失
      • 磁盘故障造成检查点损坏
    • 传统恢复方式需要:

      1. 从源头重新消费所有数据
      2. 重新执行所有计算逻辑
      3. 重建完整状态
      • 对于处理TB级数据的作业,这个过程可能需要数小时
  3. 日志压缩解决方案

    • 实施步骤:
      1. 配置定期快照策略(如每5分钟)
      2. 将内存状态序列化后写入:
        • 分布式文件系统(HDFS/S3)
        • 高性能KV存储(RocksDB)
        • 消息系统(Kafka压缩日志)
      3. 故障恢复时:
        • 加载最近的有效快照
        • 只需处理快照时间点之后的增量数据
    • 优势:
      • 恢复时间从小时级降至分钟级
      • 显著降低重复计算的开销
      • 保证处理结果的精确一次性(exactly-once)
  4. 实际应用案例

    • 电商实时大屏:
      • 崩溃后10分钟内恢复实时GMV统计
    • 金融风控系统:
      • 确保可疑交易监控不出现漏判
    • IoT设备监控:
      • 维持设备状态连续性

这种机制特别适合对计算连续性要求高、数据吞吐量大的实时处理场景,能有效平衡性能与可靠性。

使用日志压缩来替代这些外部存储有哪些优势和好处?

  • Kafka即是数据源又是存储工具,可以简化技术栈,降低维护成本
  • 使用外部存储介质的话,需要将存储的Key记录下来,恢复的时候再使用这些Key将数据取回,实现起来有一定的工程难度和复杂度。使用Kafka的日志压缩特性,只需要把数据写入Kafka,等异常出现恢复任务再读回内存就可以了
  • Kafka对于磁盘的读写做了大量的优化工作,比如磁盘顺序读写。相对于外部存储介质没有索引查询等工作量负担,可以实现高性能。同时,Kafka的日志压缩机制可以充分利用廉价的磁盘,不用依赖昂贵的内存来处理,在性能相似的情况下,实现非常高的性价比(仅针对异常处理和容灾的场景)。

日志压缩实现细节

主题的 cleanup.policy 需要设置为:compact Kafka后台线程会定时将Topic遍历两次:

  • 记录每个Key的Hash值最后一次出现的偏移量
  • 第二次检查每个Offset对应的Key是否在后面的日志中出现过,如果出现了就删除对应的日志。

日志压缩允许删除,除最后一个key外,删除先前出现的所有该Key对应的记录,在一段时间后从日志中清理以释放空间。 注意:日志压缩与Key有关,确保每个消息的Key不为Null。

压缩是在Kafka后台通过定时重新打开Segment来完成的,Segment压缩细节如下图所示: 日志压缩可以确保:

  • 任何保持在日志头部以内的使用者都将看到所写的每条消息,这些消息将具有顺序偏移量。
  • 可以使用Topic的min.compation.lag.ms属性来保证消息在被压缩之前必须经过的最短时间,也就是说,它为每个消息(未压缩)头部停留的时间提供下一个下限。可以使用Topic的max.compactiton.lag.ms属性来保证从收到消息符合压缩条件之间的最大延时
  • 消息始终保证顺序,压缩永远不会重新排序消息,只是删除一些而已
  • 消息的偏移量永远不会改变,它是日志中位置的永久标识
  • 从日志开始的任何使用者将至少看到所有记录的最终状态,按记录的顺序写入。
  • 另外,如果使用者在比Topic的log.cleaner.delete.retention.ms短的时间内到达日志的头部,则会看到已删除的所有的delete标记, 保留时间默认是24小时。

默认情况下,启动日志清理器,若需要启动特定Topic的日志清理,请添加特定的属性。

日志清理器配置详解

日志清理是Kafka维护数据存储效率的重要功能,以下是详细的配置指南:

核心配置参数

  1. log.cleanup.policy

    建议设置为compact(压缩策略),这是Broker级别的配置,会影响集群中所有Topic的行为。

    • 应用场景:适用于需要保留每个Key最新值的场景,如配置信息、状态更新等
    • 替代选项:delete(删除策略,基于时间/大小)
  2. log.cleaner.min.compaction.lag.ms

    该参数用于防止对最近更新的消息进行压缩,确保消息在指定时间内不会被清理。

    • 典型值:建议设置为消息处理所需的最长时间(如1小时)
    • 默认行为:如果未设置,除最后一个Segment外的所有Segment都可被压缩

日志压缩工作原理

Kafka的日志压缩采用"读取-处理-写入"机制:

  1. 读取阶段:扫描日志两遍

    • 第一遍:建立Key-Offset映射表
    • 第二遍:验证数据有效性
  2. 写入阶段:将有效数据写入新Segment

性能考虑因素:

  • 现代CPU处理速度通常远高于磁盘I/O
  • 压缩效率取决于:
    • 日志总量(建议控制在TB级别以下)
    • 磁盘类型(SSD性能优于HDD)
    • 消息平均大小(建议优化在1-10KB)

最佳实践建议

  1. 监控指标:重点关注cleaner-buffer-utilizationcleaner-reaper-percent指标
  2. 资源分配:为清理线程分配足够内存(通过log.cleaner.dedupe.buffer.size配置)
  3. 时间窗口:设置合理的log.cleaner.backoff.ms(默认15秒)控制压缩频率

示例配置:

properties 复制代码
log.cleanup.policy=compact
log.cleaner.min.compaction.lag.ms=3600000  # 1小时
log.cleaner.threads=4  # 根据CPU核心数调整
log.cleaner.dedupe.buffer.size=134217728  # 128MB
相关推荐
程序员爱钓鱼2 分钟前
Go语言实战案例-使用ORM框架 GORM 入门
后端
M1A13 分钟前
TCP协议详解:为什么它是互联网的基石?
后端·网络协议·tcp/ip
一枚小小程序员哈13 分钟前
基于微信小程序的家教服务平台的设计与实现/基于asp.net/c#的家教服务平台/基于asp.net/c#的家教管理系统
后端·c#·asp.net
楽码41 分钟前
自动修复GoVet:语言实现对比
后端·算法·编程语言
石榴树下44 分钟前
00. 马里奥的 OAuth 2 和 OIDC 历险记
后端
uhakadotcom44 分钟前
开源:subdomainpy快速高效的 Python 子域名检测工具
前端·后端·面试
似水流年流不尽思念1 小时前
容器化技术了解吗?主要解决什么问题?原理是什么?
后端
Java水解1 小时前
Java中的四种引用类型详解:强引用、软引用、弱引用和虚引用
java·后端
i听风逝夜1 小时前
看好了,第二遍,SpringBoot单体应用真正的零停机无缝更新代码
后端
柏油2 小时前
可视化 MySQL binlog 监听方案
数据库·后端·mysql