Kafka

kafka如何防止消息丢失?

ack=all且分区ISR数量大于等于2可以保证百分百不会丢失

kafka怎么防止消息重复消费(幂等性)?

全局消息唯一ID

生产者拦截器生成唯一ID作为消息key

消费者执行业务操作数据库和提交offset偏移量这两个操作无法百分百保证事务的原子性(kafka宕机或者数据库宕机)

可以放弃偏移量,用数据库事务的方式百分百保证不会重复消费

消费者连接的数据库建一张本地消息表,消息ID字段唯一索引

消费消息执行业务操作完数据库后往本地消息表中插入消息ID,如果消息重复了就会报唯一冲突就会事务回滚

kafka消息积压怎么优化?

1.增加消费者数量

2.增加分区数量,提高并行消费能力

3.调整消费者的消费能力和参数设置,增加每次拉取的消息数量(fetch size),调整消费者的批量处理配置(batch size)

4.水平扩展 Kafka 集群

5.优化生产者和消费者的性能,异步发送批量发送

6.监控和调整配置: 及时监控 Kafka 集群的状态和指标,例如消息积压量、消费者位移的情况等

kafka高水位机制?

reblance机制?

1.RoundRobinAssignor(轮询分配器):这是一种基本的分配策略,按照消费者实例的顺序依次分配分区,确保每个消费者实例获得近乎相等数量的分区。

2.RangeAssignor(范围分配器):这种策略将分区划分为若干范围,并将每个消费者实例分配一到多个连续范围内的分区。适用于需要将相邻分区分配给同一个消费者的场景。

3.StickyAssignor(粘性分配器):这种策略在一定程度上保持了消费者实例与分区之间的粘性关系,使得消费者在重平衡时尽量保持分区的分配稳定性。

4.CooperativeStickyAssignor(协作粘性分配器):这是一种改进版的粘性分配器,它在粘性的基础上增加了协作机制,通过消费者之间的协调来更好地处理重平衡,降低重平衡带来的消费者停滞时间。

kafka的ack应答级别?

0:生产者发送过来的数据,不需要等数据落盘应答

1:生产者发送过来的数据,Leader收到数据后应答

all:生产者发送过来的数据,Leader和ISR队列里面所有接待你收齐数据后应答。

kafka分区策略?

1.指定分区

2.没指定分区但有key,则将key的hash值取余则为分区号

3.没指定分区也没key,采用粘性分区,随机采用一个分区并一直使用这个分区直到batch满了再选用别的分区

kafka的生产者批量发送参数?

batch.size 批次大小

linger.ms 等待时间

compress.type 压缩类型

RecordAccumulator 缓冲区大小

kafka的消息是顺序的吗?

单个分区中的消息在特定条件下是的

未开启幂等性时max.in.flight.requests.per.connection=1

开启幂等性时max.in.flight.requests.per.connection小于或等于5,会在kafka内存中重新排序

多个分区中的消息无法保证全局的顺序性

相关推荐
roman_日积跬步-终至千里1 分钟前
【Java并发】用 JMM 与 Happens-Before 解决多线程可见性与有序性问题
java·开发语言·spring
空空kkk1 分钟前
SSM项目练习——hami音乐(三)
java·数据库
爬山算法10 分钟前
Hibernate(78)如何在GraphQL服务中使用Hibernate?
java·hibernate·graphql
独断万古他化15 分钟前
【Spring 核心:AOP】基础到深入:思想、实现方式、切点表达式与自定义注解全梳理
java·spring·spring aop·aop·切面编程
编程彩机27 分钟前
互联网大厂Java面试:从分布式事务到微服务优化的技术场景解读
java·spring boot·redis·微服务·面试·kafka·分布式事务
bbq粉刷匠28 分钟前
Java-排序2
java·数据结构·排序算法
编程彩机30 分钟前
互联网大厂Java面试:从Spring WebFlux到分布式事务的技术场景解析
java·微服务·面试·分布式事务·spring webflux
Jm_洋洋36 分钟前
【C++进阶】虚函数、虚表与虚指针:多态底层机制剖析
java·开发语言·c++
小马爱打代码38 分钟前
MyBatis:缓存体系设计与避坑大全
java·缓存·mybatis
时艰.44 分钟前
Java 并发编程:Callable、Future 与 CompletableFuture
java·网络