压测实操--kafka broker压测方案

作者:九月

环境信息:

操作系统centos7.9,kafka版本为hdp集群中的2.0版本。

kafka broker参数

num.replica.fetchers:副本抓取的相应参数,如果发生ISR频繁进出的情况或follower无法追上leader的情况则适当增加该值,但通常不要超过CPU核数+1;

num.io.threads:broker处理磁盘IO的线程数,主要进行磁盘io操作,高峰期可能有些io等待,因此配置需要大些,最好配置线程数量为cpu核数2倍,最大不超过3倍;

num.network.threads:broker处理消息的最大线程数,和我们生产消费的thread很类似主要处理网络io,读写缓冲区数据,基本没有io等待,最好配置线程数量为cpu核数加1;

num.replica.fetchers

集群中默认配置是1,调整该参数,观察吞吐速率。

调整num.replica.fetchers配置后,使用kafka-consumer-perf-test.sh脚本获取吞吐速率。

bash 复制代码
/usr/hdp/3.1.5.0-152/kafka/bin/kafka-consumer-perf-test.sh --broker-list 172.16.120.30:6667,172.16.120.36:6667,172.16.120.37:6667 --topic test_kafka_broker --messages 1000000 --fetch-size  1048576

num.io.threads

集群中默认配置是8,调整该参数,观察吞吐速率。

调整num.io.threads配置后,使用kafka-consumer-perf-test.sh脚本获取吞吐速率。

bash 复制代码
/usr/hdp/3.1.5.0-152/kafka/bin/kafka-consumer-perf-test.sh --broker-list 172.16.120.30:6667,172.16.120.36:6667,172.16.120.37:6667 --topic test_kafka_broker --messages 1000000 --fetch-size  1048576

num.network.threads

集群中默认配置是3,调整该参数,观察吞吐速率。

调整num.network.threads配置后,使用kafka-consumer-perf-test.sh脚本获取吞吐速率。

bash 复制代码
/usr/hdp/3.1.5.0-152/kafka/bin/kafka-consumer-perf-test.sh --broker-list 172.16.120.30:6667,172.16.120.36:6667,172.16.120.37:6667 --topic test_kafka_broker --messages 1000000 --fetch-size  1048576

总结

通过调整集群中kafka broker的参数配置,获取不同参数下的吞吐速率。对broker参数的优化应当结合集群主机中的硬件资源进行适当调整。通过调整测试获取最合适的参数配置。

更多技术信息请查看云掣官网https://yunche.pro/?t=yrgw

相关推荐
惊讶的猫11 小时前
rabbitmq初步介绍
分布式·rabbitmq
小镇敲码人11 小时前
华为CANN框架中HCCL仓库的全面解析:分布式通信的引擎
分布式·华为
User_芊芊君子12 小时前
【分布式训练】CANN SHMEM跨设备内存通信库:构建高效多机多卡训练的关键组件
分布式·深度学习·神经网络·wpf
酷酷的崽79812 小时前
CANN 开源生态解析(四):`cann-dist-train` —— 构建高效可扩展的分布式训练引擎
分布式·开源
惊讶的猫13 小时前
AMQP 与 RabbitMQ 四大模型
分布式·rabbitmq
灰子学技术13 小时前
istio从0到1:如何解决分布式配置同步问题
分布式·云原生·istio
小马爱打代码13 小时前
ZooKeeper:入门实战
分布式·zookeeper·云原生
永远都不秃头的程序员(互关)14 小时前
CANN赋能AIGC分布式训练:硬核通信,加速大模型智能生成新纪元
分布式·aigc
杜子不疼.15 小时前
CANN集合通信库HCCL的大规模分布式训练通信优化与拓扑感知实践
分布式
ALex_zry1 天前
Redis Cluster 分布式缓存架构设计与实践
redis·分布式·缓存