第三节:kafka sarama 遇到Bug?

文章目录


前言

前面两节,我们已经简单应用了sarama的两个类型Client和ClusterAdmin,其中有一个案例是获取集群的ControllerId,但是在后面的测试过程过程中,发现一个问题,返回的ControllerID是随机的,这个是什么原因呢,我们下面分析下


一、先上结果

下图展示了我用四种方式,获取到的ControllerId的信息,分别是

ClusterAdmin 的 DescribeCluster()

ClusterAdmin 的 Controller()

Client的 Controller()

Clinet的 RefreshController()

可以看到每次返回的四个结果都不一致

开始我也怀疑是不是我的kafka集群本身有问题,但是通过kafka工具查看

复制代码
./bin/kafka-metadata-quorum.sh --bootstrap-server 172.20.37.227:34997  descr
ibe  --status

集群的Controller的LeaderID尽管在更新,但是不会短时间内迅速切换,所以集群没有问题。

二、刨根问底

ControllerID返回结果随机是什么原因呢,一顿查找,终于是找的一个类似的问题。

传送门:
DescribeCluster() returns random broker ID as the controller ID under KRaft mode #2521

这个开发者也是遇到和我一样的困惑,为什么获取到的ControllerID和kafka-metadata-quorum.sh获取的不一致呢。

解答在这里:

kafka 在kraft模式是希望您将请求发送到集群中的任何节点,并且它会相应地进行负载平衡

目前我们用的sarama v1.42.2版本还是有这个问题的,但是作者,提示会在后期更新类似的方法,获得我们需要的结果。

总结

sarama本身也是遵循了kafka kraft版本的代码行为,就使用来说,对客户端是无所谓的,有人相应就好,但是作为运维和排查问题角度,还是需要一个方法,获取到目前集群的Controler的Leader具体是哪个节点。我们可以继续关注这个问题。

相关推荐
小马爱打代码13 分钟前
ZooKeeper:入门实战
分布式·zookeeper·云原生
永远都不秃头的程序员(互关)1 小时前
CANN赋能AIGC分布式训练:硬核通信,加速大模型智能生成新纪元
分布式·aigc
杜子不疼.2 小时前
CANN集合通信库HCCL的大规模分布式训练通信优化与拓扑感知实践
分布式
ALex_zry14 小时前
Redis Cluster 分布式缓存架构设计与实践
redis·分布式·缓存
为什么不问问神奇的海螺呢丶16 小时前
n9e categraf rabbitmq监控配置
分布式·rabbitmq·ruby
TTBIGDATA20 小时前
【Atlas】Atlas Hook 消费 Kafka 报错:GroupAuthorizationException
hadoop·分布式·kafka·ambari·hdp·linq·ranger
m0_687399841 天前
telnet localhost 15672 RabbitMQ “Connection refused“ 错误表示目标主机拒绝了连接请求。
分布式·rabbitmq
indexsunny1 天前
互联网大厂Java面试实战:微服务与Spring生态技术解析
java·spring boot·redis·kafka·mybatis·hibernate·microservices
陌上丨1 天前
生产环境分布式锁的常见问题和解决方案有哪些?
分布式
新新学长搞科研1 天前
【智慧城市专题IEEE会议】第六届物联网与智慧城市国际学术会议(IoTSC 2026)
人工智能·分布式·科技·物联网·云计算·智慧城市·学术会议