Kafka

kafka如何防止消息丢失?

ack=all且分区ISR数量大于等于2可以保证百分百不会丢失

kafka怎么防止消息重复消费(幂等性)?

全局消息唯一ID

生产者拦截器生成唯一ID作为消息key

消费者执行业务操作数据库和提交offset偏移量这两个操作无法百分百保证事务的原子性(kafka宕机或者数据库宕机)

可以放弃偏移量,用数据库事务的方式百分百保证不会重复消费

消费者连接的数据库建一张本地消息表,消息ID字段唯一索引

消费消息执行业务操作完数据库后往本地消息表中插入消息ID,如果消息重复了就会报唯一冲突就会事务回滚

kafka消息积压怎么优化?

1.增加消费者数量

2.增加分区数量,提高并行消费能力

3.调整消费者的消费能力和参数设置,增加每次拉取的消息数量(fetch size),调整消费者的批量处理配置(batch size)

4.水平扩展 Kafka 集群

5.优化生产者和消费者的性能,异步发送批量发送

6.监控和调整配置: 及时监控 Kafka 集群的状态和指标,例如消息积压量、消费者位移的情况等

kafka高水位机制?

reblance机制?

1.RoundRobinAssignor(轮询分配器):这是一种基本的分配策略,按照消费者实例的顺序依次分配分区,确保每个消费者实例获得近乎相等数量的分区。

2.RangeAssignor(范围分配器):这种策略将分区划分为若干范围,并将每个消费者实例分配一到多个连续范围内的分区。适用于需要将相邻分区分配给同一个消费者的场景。

3.StickyAssignor(粘性分配器):这种策略在一定程度上保持了消费者实例与分区之间的粘性关系,使得消费者在重平衡时尽量保持分区的分配稳定性。

4.CooperativeStickyAssignor(协作粘性分配器):这是一种改进版的粘性分配器,它在粘性的基础上增加了协作机制,通过消费者之间的协调来更好地处理重平衡,降低重平衡带来的消费者停滞时间。

kafka的ack应答级别?

0:生产者发送过来的数据,不需要等数据落盘应答

1:生产者发送过来的数据,Leader收到数据后应答

all:生产者发送过来的数据,Leader和ISR队列里面所有接待你收齐数据后应答。

kafka分区策略?

1.指定分区

2.没指定分区但有key,则将key的hash值取余则为分区号

3.没指定分区也没key,采用粘性分区,随机采用一个分区并一直使用这个分区直到batch满了再选用别的分区

kafka的生产者批量发送参数?

batch.size 批次大小

linger.ms 等待时间

compress.type 压缩类型

RecordAccumulator 缓冲区大小

kafka的消息是顺序的吗?

单个分区中的消息在特定条件下是的

未开启幂等性时max.in.flight.requests.per.connection=1

开启幂等性时max.in.flight.requests.per.connection小于或等于5,会在kafka内存中重新排序

多个分区中的消息无法保证全局的顺序性

相关推荐
pengyu9 分钟前
【Java设计原则与模式之系统化精讲:壹】 | 编程世界的道与术(实战指导篇)
java·后端·设计模式
日月星辰Ace12 分钟前
JVM 垃圾回收简介
java
掉头发的王富贵15 分钟前
Arthas神器入门:动态调试Java应用,轻松搞定生产环境Bug!
java·后端·debug
Java陈序员20 分钟前
再见 Navicat!一款开源的 Web 数据库管理工具!
java·react.js·docker
库森学长29 分钟前
Kafka为什么这么快?
后端·面试·kafka
知其然亦知其所以然36 分钟前
RAG 结果太水?用 RRF + Reranker 重排,效果翻倍提升!
java·后端·llm
SimonKing38 分钟前
吊打面试官系列:Spring为什么不推荐使用字段依赖注入?
java·后端·架构
魔镜魔镜_谁是世界上最漂亮的小仙女1 小时前
java-集合
java·后端·程序员
真实的菜1 小时前
消息队列高级特性与原理:解锁分布式系统的底层逻辑
java
若水不如远方1 小时前
java范型
java