kafka压缩

最近有幸公司参与kafka消息压缩,背景是日志消息量比较大。kafka版本2.4.1

一、确认压缩算法

根据场景不同选择不同。如果是带宽敏感患者推荐高压缩比的zstd,如果是cpu敏感患者推荐lz4

lz4和zstd底层都使用的是lz77算法,具体实现逻辑不同,根据我们现有日志消息计算最高压缩比。

最终结合我们生产环境最终是确认了使用lz4压缩算法。

二、压缩相关的参数

除了这几个基本的参数外,还需要相应的调整kafka的参数。

参数 作用范围 描述 默认值 关键依赖关系 场景/注意事项
message.max.bytes Broker Broker 允许接收的单个消息最大大小(含消息头、键、值)。 1048588 (1MB) 生产者需设置 max.request.size ≤ 此值;消费者需设置 max.partition.fetch.bytes ≥ 此值 若消息超过此值,生产者会被 Broker 拒绝。需与生产者和消费者参数协同配置。
replica.fetch.max.bytes 副本同步(Broker) 副本从 Leader 分区单次拉取数据的最大字节数。 1048576 (1MB) 必须 ≥ message.max.bytes,否则副本无法同步大消息 若设置过小,可能导致副本频繁掉出 ISR 列表。
fetch.message.max.bytes 消费者(旧版本) 已弃用 ,替代参数为 max.partition.fetch.bytes 旧版本默认同 max.partition.fetch.bytes 无(建议使用新参数) 旧版本兼容性参数,新版本无需关注。
max.partition.fetch.bytes 消费者 消费者从单个分区单次拉取数据的最大字节数。 1048576 (1MB) 必须 ≥ message.max.bytes,否则无法消费大消息 若分区中某条消息大小超过此值,消费者会抛出异常。
num.replica.fetchers 副本同步(Broker) Broker 用于副本同步的线程数。增加此值可提升副本同步并行度。 1 无直接依赖,但需根据集群负载调整 分区数多或吞吐量高时,增大此值可加速副本同步。
replica.lag.time.max.ms 副本同步(Broker) 副本若在此时间内未向 Leader 同步数据,则被标记为不同步(移出 ISR)。 30000 (30秒) 无直接依赖 设置过短可能导致副本频繁移出 ISR;过长可能容忍滞后副本(影响可靠性)。

接着就是根据prometheus图 不断调整参数找到最适合的参数

相关推荐
倔强的石头_4 小时前
kingbase备份与恢复实战(二)—— sys_dump库级逻辑备份与恢复(Windows详细步骤)
数据库
jiayou641 天前
KingbaseES 实战:深度解析数据库对象访问权限管理
数据库
李广坤2 天前
MySQL 大表字段变更实践(改名 + 改类型 + 改长度)
数据库
DemonAvenger3 天前
Kafka性能调优:从参数配置到硬件选择的全方位指南
性能优化·kafka·消息队列
爱可生开源社区3 天前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
随逸1773 天前
《从零搭建NestJS项目》
数据库·typescript
加号34 天前
windows系统下mysql多源数据库同步部署
数据库·windows·mysql
シ風箏4 天前
MySQL【部署 04】Docker部署 MySQL8.0.32 版本(网盘镜像及启动命令分享)
数据库·mysql·docker
李慕婉学姐4 天前
Springboot智慧社区系统设计与开发6n99s526(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库·spring boot·后端
百锦再4 天前
Django实现接口token检测的实现方案
数据库·python·django·sqlite·flask·fastapi·pip