《深入理解kafka-核心设计与实践原理》第四章:主题和分区

第四章:主题和分区

[4.1 主题管理](#4.1 主题管理)

[4.1.1 创建主题](#4.1.1 创建主题)

[4.2 KafkaAdminClient](#4.2 KafkaAdminClient)

[4.3 分区管理](#4.3 分区管理)

[4.3.1 优先副本的选举](#4.3.1 优先副本的选举)

[4.3.2 分区重分配(Partition Reassignment)](#4.3.2 分区重分配(Partition Reassignment))

[4.3.3 复制限流](#4.3.3 复制限流)

[4.3.4 修改副本因子](#4.3.4 修改副本因子)

[4.4 分区和性能的考量因素](#4.4 分区和性能的考量因素)

第四章:主题和分区

4.1 主题管理

一般通过kafka-topics.sh脚本来执行包括创建主题、查看主题信息、修改主题和删除主题等操作

4.1.1 创建主题

  • 如果broker端配置参数auto.create.topics.enable设置为 true(默认值就是 true),那么当生产者向一个尚未创建的主题发送消息时,会自动创建一个分区数为num.partitions(默认值为1)、副本因子为default.replication.factor(默认值为1)的主题。一般情况下不推荐设置成true

  • 建议通过kafka-topics.sh 脚本来创建主题

  • 主题、分区、副本和 Log (日志)的关系

4.2 KafkaAdminClient

从0.11.0.0版本开始,Kafka提供了工具类org.apache.kafka.clients.admin.KafkaAdminClient来实现部分Kafka的管理功能,主要有以下几个方法

  • 创建主题:CreateTopicsResult createTopics(Collection<NewTopic> newTopics)
  • 删除主题:DeleteTopicsResult deleteTopics(Collection<String> topics)
  • 列出所有可用的主题:ListTopicsResult listTopics()
  • 查看主题的信息:DescribeTopicsResult describeTopics(Collection<String> topicNames)
  • 查询配置信息:DescribeConfigsResult describeConfigs(Collection<ConfigResource> resources)
  • 修改配置信息:AlterConfigsResult alterConfigs(Map<ConfigResource, Config> configs)
  • 增加分区:CreatePartitionsResultcreatePartitions(Map<String, NewPartitions> newPartitions)

4.3 分区管理

本节主要介绍与分区相关的知识和操作,包括优先副本的选举、分区重分配、复制限流、修改副本因子等内容

4.3.1 优先副本的选举

一般而言,对于同一个分区,同一个broker节点中不可能出现它的多个副本,即 Kafka集群的一个 broker中最多只能有它的一个副本

  • 背景:leader宕机引起的集群负载均衡失衡,从而影响整体的健壮性和稳定性
    • 在创建主题时,该主题的分区及副本会尽可能均匀地分布到Kafka集群的各个broker节点上,对应的leader副本的分配也比较均匀(下图中,三个分区的leader节点分别在broker 0、1、2上)
  • 随着时间的更替,Kafka集群的broker节点不可避免地会遇到宕机或崩溃的问题,当分区的leader节点发生故障时,其中一个follower节点就会成为新的 leader节点,这样就会导致集群的负载不均衡,从而影响整体的健壮性和稳定性(下图中,原本分区1的leader节点2宕机,现在变成了0,使得整体负载失衡,节点0承载了2个leader节点)
  • 如何应对:为了能够有效地治理负载失衡的情况,Kafka引入了优先副本(preferred replica)的概念
    • 优先副本:指在AR集合列表中的第一个副本。如下图主题topic-partitions中,分区0的AR集合列表为[1,2,0],那么分区0的优先副本即为1
    • 理想情况下,优先副本就是该分区的leader副本。Kafka要确保所有主题的优先副本在Kafka集群中均匀分布,这样就保证了所有分区的leader均衡分布
  • 优先副本的选举:指通过一定的方式促使优先副本选举为leader副本,以此来促进集群的负载均衡,这一行为也可以称为"分区平衡"
    • 在Kafka中可以提供分区自动平衡的功能:通过设置broker端参数auto.leader.rebalance.enable=true(默认也为true)
    • 设置该参数开启后,Kafka会启动一个定时任务,定时轮询所有的broker节点,计算每个broker节点的分区不平衡率,如果超过leader.imbalance.per.broker.percentage参数(默认10%),则会自动执行优先副本的选举动作以求分区平衡
      • broker中的分区不平衡率 = 非优先副本的leader个数 / 分区总数
    • 不过生产环境中不建议将该参数设置为true,因为可能会引起负面性能问题(比如电商大促波峰期阻塞了业务)

4.3.2 分区重分配(Partition Reassignment)

  • 背景:当集群中某一节点(broker)下线或新增,会打破原先集群的负载均衡。为解决该问题,引入重分配的工作,它可以在集群扩容、 broker节点失效的场景下对分区进行迁移
  • 重分配原理:先通过控制器为每个分区添加新副本(增加副本因子),新的副本将从分区的leader副本那里复制所有的数据。根据分区的大小不同, 复制过程可能需要花一些时间。在复制完成之后,控制器将旧副本从副本清单里移除(恢复为原先的副本因子数)
  • 弊端:分区重分配对集群的性能有很大的影响,需要占用额外的资源,比如网络和磁盘。在实际操作中,我们将降低重分配的粒度,分成多个小批次来执行,以此来将负面的影响降到最低
  • 与rebalance(再平衡)的区别
    • 重分配:作用在broker层面,是broker与partition间的分配;通常是为了管理优化集群手动触发
      • 触发条件:broker加入/离开集群
      • 目的:维护集群负载均衡(指broker和partition间)
    • 再平衡:作用在消费组层面(新增/下线消费者),Rebalance的目的是确保分区在consumer group成员之间平均分配,以便每个consumer都有分区去消费;通常是Kafka协调器自动触发的
      • 触发条件:消费者组中的成员发生变化(如新消费者加入、现有消费者离开或失败)
      • 目的:维护partition与消费者之间的平衡

4.3.3 复制限流

  • 在4.3.2中提到重分配本质在于数据复制。即先增加新的副本,然后进行数据同步,最后删除旧的副本来达到最终的目的
  • 数据复制会占用额外的资源,这时就需要有一个限流的限制
  • broker级别限流参数
    • follower.replication.throttled.rate:follower副本复制的速度
    • leader.replicatioη.throttled.rate:leader副本传输的速度
  • topic级别限流参数
    • leader.replication.throttled.replicas
    • follower.replication.throttled.replicas

4.3.4 修改副本因子

  • 指创建主题之后修改副本因子(副本数),通过kafka-reassign-partition.sh脚本实现

4.4 分区和性能的考量因素

  • Kafka本身提供的性能测试工具
  • 分区与吞吐量的关系
    • 如何衡量消息中间件性能:吞吐量(广义来说还包含消息延迟)
    • 影响吞吐量的因素:消息大小、消息压缩方式、消息发送方式(同步/异步)、消息确认类型(acks)、副本因子等参数
    • 分区与吞吐量的测试结论:从吞吐量方面考虑,增加合适的分区数 可以在一定程度上提升整体吞吐量,但超过对应的阐值之后吞吐量不升反降(分区太多会引起kafka进程崩溃)
      • 分区太多的缺点
        • 分区数越多会让Kafka的正常启动和关闭的耗时变得越长,增加日志清理的耗时
        • 分区数会占用文件描述符,分区太多会增加文件句柄开销
  • 如何考量合适的分区数
    • 是否要保证顺序消费:分区数只能为1
    • 一般情况下,考虑未来2年的吞吐量,及key与分区数是否存在相关定制化规则
相关推荐
hanbarger1 小时前
分布式通信,微服务协调组件,zookeeper
分布式·zookeeper·中间件
郭源潮3452 小时前
Hadoop
大数据·hadoop·分布式
Allen Bright3 小时前
RabbitMQ中的普通Confirm模式:深入解析与最佳实践
分布式·rabbitmq
dzend3 小时前
Kafka、RocketMQ、RabbitMQ 对比
kafka·rabbitmq·rocketmq
李昊哲小课4 小时前
deepin 安装 kafka
大数据·分布式·zookeeper·数据分析·kafka
Kobebryant-Manba4 小时前
zookeeper+kafka的windows下安装
分布式·zookeeper·kafka
_oP_i11 小时前
Pinpoint 是一个开源的分布式追踪系统
java·分布式·开源
lucky_syq13 小时前
Flume和Kafka的区别?
大数据·kafka·flume
观测云13 小时前
Confluent Cloud Kafka 可观测性最佳实践
kafka·confluent
攻心的子乐13 小时前
Kafka可视化工具 Offset Explorer (以前叫Kafka Tool)
分布式·kafka