Kafka Topic分区重分布

在扩容完kafka的broker以后,现有的topic分区不会自动迁移到新增节点上。需要手动对每个topic进行重分布

示例:

查看当前topic

复制代码
/home/kafka/kafka/kafka-1.1.0/bin/kafka-topics.sh --zookeeper 192.168.0.1:2181 --describe --topic gwtest01

当前topic有6个分区2个副本, 分布在1001,1002,1003 三个broker上,

然后扩容kafka,新增了一个broker,新增的节点broker_id 为 1004

先创建一个kafka_topic.json 内容为:

复制代码
{"topics":[{"topic": "gwtest01"}],"version":1}

就是配置好需要处理的topic名称

生成随机重分布文件:

复制代码
/home/kafka/kafka/kafka-1.1.0/bin/kafka-reassign-partitions.sh  --broker-list 1001,1002,1003,1004  --zookeeper 192.168.0.1:2181 --generate --topics-to-move-json-file kafka_topic.json

其中:--broker-list 指定需要分布的broker id,这个brokerid不一定是按顺序生成的,想要查询当前集群所有的broker id , 可以进入每个broker的数据目录,cat meta.properties

--topics-to-move-json-file 指定刚刚的文件

命令执行完成,会输出现有topic分区分布,和生成的随机分布规划

手动将下面的json串复制到新文件partition_assignment.json

复制代码
{"version":1,"partitions":[{"topic":"gwtest03","partition":1,"replicas":[1004,1001],"log_dirs":["any","any"]},{"topic":"gwtest03","partition":3,"replicas":[1002,1003],"log_dirs":["any","any"]},{"topic":"gwtest03","partition":0,"replicas":[1003,1004],"log_dirs":["any","any"]},{"topic":"gwtest03","partition":5,"replicas":[1004,1002],"log_dirs":["any","any"]},{"topic":"gwtest03","partition":2,"replicas":[1001,1002],"log_dirs":["any","any"]},{"topic":"gwtest03","partition":4,"replicas":[1003,1001],"log_dirs":["any","any"]}]}

执行分布:

复制代码
/home/kafka/kafka/kafka-1.1.0/bin/kafka-reassign-partitions.sh  --zookeeper 192.168.0.1:2181 --execute --reassignment-json-file partition_assignment.json

命令执行完再去查看topic分区状态,发现迁移完成

也可以使用以下命令查看分布的状态:

复制代码
/home/kafka/kafka/kafka-1.1.0/bin/kafka-reassign-partitions.sh  --zookeeper 192.168.0.1:2181 --verify --reassignment-json-file  partition_assignment.json
相关推荐
【D'accumulation】11 小时前
如何快速解决某些文件保存不了权限问题
kafka
johnny_hhh11 小时前
Confluent 单节点部署配置
运维·阿里云·zookeeper·kafka·centos·数据可视化
鲨莎分不晴11 小时前
大数据的“大动脉”:深度剖析 Apache Kafka 的高性能之道
大数据·kafka·apache
oMcLin11 小时前
如何在 RHEL 7 上通过配置 Apache Kafka 集群的分区机制,提升消息传递系统的吞吐量与数据流处理能力?
分布式·kafka·apache
yumgpkpm12 小时前
华为 GaussDB 商业版(本地部署)部署方案及相关步骤
hive·hadoop·redis·elasticsearch·华为·kafka·gaussdb
【D'accumulation】14 小时前
Kafka地址映射不通(很常见的问题)
分布式·kafka
雨中飘荡的记忆1 天前
Kafka入门:从零开始掌握消息队列
kafka
indexsunny1 天前
互联网大厂Java面试实战:Spring Boot与微服务在电商场景的应用解析
java·spring boot·redis·微服务·kafka·gradle·maven
小辉笔记1 天前
kafka原理总结
分布式·kafka