kafka 面试

1 kafka 可以脱离 zookeeper 单独使用吗?为什么?

Kafka 从版本 0.10.1.0 开始支持在某些场景下脱离对 Zookeeper 的依赖,引入了基于 Raft 协议的 Kafka Controller。这意味着在一些简单的使用情况下,Kafka 可以脱离 Zookeeper 单独使用。但在生产环境中,建议还是保留 Zookeeper,因为它在 Kafka 集群中担任着重要的角色,包括保存集群的元数据、broker 的健康状态等。

2 kafka 有几种数据保留的策略?

基于时间的保留策略:根据消息的时间戳来决定消息的保留时间。

基于大小的保留策略:根据日志段文件的大小来决定消息的保留。

3 kafka 同时设置了 7 天和 10G 清除数据,到第五天的时候消息达到了 10G,这个时候 kafka 将如何处理?

当设置了同时基于时间和大小的数据清除策略时,如果在第五天时消息达到了 10G,Kafka 将按照优先级较高的清除策略来进行数据清除,即先清除时间超过 7 天的消息,直到满足数据大小不超过 10G的条件。

4 什么情况会导致 kafka 运行变慢?

硬件性能不足:包括磁盘、内存、网络等硬件资源限制。

配置不当:例如未能合理配置分区数量、副本数量等参数。

网络故障:Kafka 集群中的网络通信故障会导致性能下降。

消费者处理不及时:如果消费者处理速度跟不上消息产生速度,会导致积压,进而影响 Kafka 性能。

5 使用 kafka 集群需要注意什么?

合理的分区规划和副本分配,避免出现热点分区。

监控 Kafka 集群的健康状态,包括各个 broker 的负载情况、消息堆积情况等。

注意数据的备份和容灾规划,确保数据不会因为故障丢失。

合理配置数据保留策略,避免数据无限增长导致存储问题。

相关推荐
身如柳絮随风扬6 分钟前
多数据源切换实战:从业务场景到3种实现方案全解析
java·分布式·微服务
weisian15118 分钟前
基础篇--概念原理-2-参数是什么?——从原理到实战,一篇讲透
面试·职场和发展·模型参数·7b和70b·参数=规则,不是原始数据
AI人工智能+电脑小能手1 小时前
【大白话说Java面试题】【Java基础篇】第26题:Java的抽象类和接口有哪些区别
java·开发语言·面试
AIMath~1 小时前
雪花算法+ZooKeeper解决方案+RPC是什么
分布式·zookeeper·云原生
KmSH8umpK2 小时前
Redis分布式锁从原生手写到Redisson高阶落地,附线上死锁复盘优化方案进阶第六篇
数据库·redis·分布式
空中海3 小时前
Kafka :存储、复制与可靠性
分布式·kafka·linq
渣渣盟3 小时前
构建企业级实时数据管道:Kafka + Flink 最佳实践
分布式·flink·kafka
逻辑驱动的ken4 小时前
Java高频面试考点场景题20
java·开发语言·深度学习·面试·职场和发展
Wect4 小时前
深度剖析浏览器跨域问题
前端·面试·浏览器
KmSH8umpK4 小时前
Redis分布式锁从原生手写到Redisson高阶落地,附线上死锁复盘优化方案进阶第四篇
数据库·redis·分布式