压测实操--kafka broker压测方案

作者:九月

环境信息:

操作系统centos7.9,kafka版本为hdp集群中的2.0版本。

kafka broker参数

num.replica.fetchers:副本抓取的相应参数,如果发生ISR频繁进出的情况或follower无法追上leader的情况则适当增加该值,但通常不要超过CPU核数+1;

num.io.threads:broker处理磁盘IO的线程数,主要进行磁盘io操作,高峰期可能有些io等待,因此配置需要大些,最好配置线程数量为cpu核数2倍,最大不超过3倍;

num.network.threads:broker处理消息的最大线程数,和我们生产消费的thread很类似主要处理网络io,读写缓冲区数据,基本没有io等待,最好配置线程数量为cpu核数加1;

num.replica.fetchers

集群中默认配置是1,调整该参数,观察吞吐速率。

调整num.replica.fetchers配置后,使用kafka-consumer-perf-test.sh脚本获取吞吐速率。

bash 复制代码
/usr/hdp/3.1.5.0-152/kafka/bin/kafka-consumer-perf-test.sh --broker-list 172.16.120.30:6667,172.16.120.36:6667,172.16.120.37:6667 --topic test_kafka_broker --messages 1000000 --fetch-size  1048576

num.io.threads

集群中默认配置是8,调整该参数,观察吞吐速率。

调整num.io.threads配置后,使用kafka-consumer-perf-test.sh脚本获取吞吐速率。

bash 复制代码
/usr/hdp/3.1.5.0-152/kafka/bin/kafka-consumer-perf-test.sh --broker-list 172.16.120.30:6667,172.16.120.36:6667,172.16.120.37:6667 --topic test_kafka_broker --messages 1000000 --fetch-size  1048576

num.network.threads

集群中默认配置是3,调整该参数,观察吞吐速率。

调整num.network.threads配置后,使用kafka-consumer-perf-test.sh脚本获取吞吐速率。

bash 复制代码
/usr/hdp/3.1.5.0-152/kafka/bin/kafka-consumer-perf-test.sh --broker-list 172.16.120.30:6667,172.16.120.36:6667,172.16.120.37:6667 --topic test_kafka_broker --messages 1000000 --fetch-size  1048576

总结

通过调整集群中kafka broker的参数配置,获取不同参数下的吞吐速率。对broker参数的优化应当结合集群主机中的硬件资源进行适当调整。通过调整测试获取最合适的参数配置。

更多技术信息请查看云掣官网https://yunche.pro/?t=yrgw

相关推荐
铁锹少年1 小时前
当多进程遇上异步:一次 Celery 与 Async SQLAlchemy 的边界冲突
分布式·后端·python·架构·fastapi
Naylor2 小时前
玩转kafka
spring boot·kafka
大千AI助手2 小时前
分布式奇异值分解(SVD)详解
人工智能·分布式·spark·奇异值分解·svd·矩阵分解·分布式svd
明达智控技术2 小时前
MR30分布式IO在自动上料机的应用
分布式·物联网·自动化
亿牛云爬虫专家2 小时前
用 Playwright + 容器化做分布式浏览器栈:调度、会话管理与资源回收
分布式·docker·容器·浏览器·爬虫代理·新闻网站·playwright
yours_Gabriel2 小时前
【分布式事务】Seata分布式解决方案
java·分布式·微服务
wearegogog1233 小时前
用docker搭建selenium grid分布式环境
分布式·selenium·docker
敲上瘾5 小时前
Linux系统C++开发环境搭建工具(三)—— brpc使用指南
linux·c++·分布式·rpc
linyb极客之路7 小时前
Kafka 租户隔离全攻略:五种生产级方案实战与选型指南
kafka
qq_12498707537 小时前
基于hadoop的电商用户行为分析系统(源码+论文+部署+安装)
大数据·hadoop·分布式·毕业设计