Kafka面试夺命连环30问（一）

1、kafka消息发送的流程？

2、Kafka 的设计架构你知道吗？

Kafka 的设计架构以高吞吐量、高可用性和可扩展性为目标，采用分布式的方式通过分区、复制和消费者组等机制实现了这些目标。它通过结合 Producer、Broker、Consumer、ZooKeeper 等组件的协作，提供了一个强大的消息流处理平台。

3、Kafka 分区的目的？

4、你知道 Kafka 是如何做到消息的有序性？

Kafka 的消息顺序性是 在分区内保证顺序 的，通过顺序写入、偏移量管理和领导者-追随者模式来确保每个分区内消息的顺序性。而 跨分区的顺序性 并没有保证，生产者可以通过合理的分区设计（例如使用消息键）来间接实现顺序控制。通过这种设计，Kafka 能在保证高吞吐量和高并发的同时，也确保了消息的有序性，尤其是在分区级别。

5、ISR、OSR、AR 是什么？

6、Kafka 在什么情况下会出现消息丢失

7、怎么尽可能保证 Kafka 的可靠性

8、Kafka中如何做到数据唯一，即数据去重？

9、生产者如何提高吞吐量？

10、zk在kafka集群中有何作用

在传统的 Kafka 集群架构中，Zookeeper 扮演着集群协调器的角色，负责管理 Kafka 集群的元数据、执行 Leader 选举、消费者组管理、配置管理以及分区副本同步等任务。Zookeeper 为 Kafka 集群提供了可靠的协调机制，确保了 Kafka 集群的高可用性和一致性。
然而，随着 KRaft 模式（Kafka Raft）引入，Kafka 正在逐步减少对 Zookeeper 的依赖，并试图实现完全通过 Kafka 自身的协议进行协调管理。这一变化将进一步简化 Kafka 的架构并提高其可扩展性。

11、简述kafka集群中的Leader选举机制

Leader选举是Kafka保证数据一致性和高可用性的重要机制，Zookeeper协调每个分区的Leader选举，并通过副本同步保证数据的可靠性。通过这种机制，即使某个Broker故障，Kafka集群也能继续工作，并能快速恢复。

12、kafka是如何处理数据乱序问题的。

13、kafka中节点如何服役和退役

Kafka集群中的节点服役和退役是通过Zookeeper和Kafka内部的控制器来协调和管理的。服役时，新节点通过Zookeeper注册并进行分区迁移，确保数据高可用性；退役时，节点会停止服务并触发分区副本迁移，确保集群的健康运行。在整个过程中，Kafka致力于最小化对集群性能的影响，并保证数据的安全和一致性

14、Kafka中Leader挂了，Follower挂了，然后再启动，数据如何同步？

Leader选举：当Leader挂掉时，Kafka会通过Zookeeper和控制器选举新的Leader，确保集群继续运行。
ISR（In-Sync Replicas）：Kafka通过ISR列表确保只有同步的副本才会被选为Leader或提供服务。副本同步滞后太多时会被临时移除ISR列表。
数据恢复与同步：恢复的Leader或Follower会从当前的Leader节点同步数据，直到其数据一致。
副本数量：通过合理配置副本数量（通常为3个），可以提高集群的容错能力，减少数据丢失的风险。

15、kafka中初始化的时候Leader选举有一定的规律，如何打破这个规律呢？

修改 auto.leader.rebalance.enable 和 preferred.leader.election.enable 配置，控制是否自动重新平衡 Leader。
手动触发 Leader 选举 ，使用 kafka-leader-election.sh 工具。
调整分区副本分配策略，通过自定义分区器改变副本的分配方式。
改变 Broker 优先级，调整集群中不同 Broker 的优先级。
使用自定义的控制器逻辑，但这种方式较为复杂。