Kafka-服务端-GroupCoordinator

在每一个Broker上都会实例化一个GroupCoordinator对象,Kafka按照Consumer Group的名称将其分配给对应的GroupCoordinator进行管理;

每个GroupCoordinator只负责管理Consumer Group的一个子集,而非集群中全部的Consumer Group。

请注意与KafkaController以及副本机制中的主从模式的区别。

GroupCoordinator有几项比较重要的功能:

一是负责处理JoinGroupRequest和SyncGroupRequest完成Consumer Group中分区的分配工作;

二是通过GroupMetadataManager和内部Topic"Offsets Topic"维护offset信息,即使出现消费者宕机也可以找回之前提交的offset;

三是记录Consumer Group的相关信息,即使Broker宕机导致Consumer Group由新的GroupCoordinator进行管理,新GroupCoordinator也可以知道Consumer Group中每个消费者负责处理哪个分区等信息;

四是通过心跳消息检测消费者的状态。

GroupCoordinator中使用MemberMetadata记录消费者的元数据,MemberMetadata中各字段的含义和功能如下所述。

  • memberld:对应消费者的id,此值是由服务端的GroupCoordinator分配的。
  • groupld:记录消费者所在的Consumer Group的id。
  • assignment:ArrayByte类型,记录了分配给当前Member的分区信息。
  • supportedProtocols:对应消费者支持的PartitionAssignor。
  • awaitingJoinCallback:与JoinGroupRequest相关的回调函数,后面详述。
  • awaitingSyncCallback:与SyncGroupRequest相关的回调函数,后面详述。
  • sessionTimeoutMs:心跳超时时间。
  • latestHeartbeat:最后一次收到心跳消息的时间戳。
  • isLeaving:标识对应消费者是否已经离开了Consumer Group。

MemberMetadata.vote方法提供了从给定候选PartitionAssignor中选择消费者支持的PartitionAssignor的功能。

GroupMetadata记录了Consumer Group的元数据信息,其字段的含义如下所述。

  • groupld:对应Consumer Group的id。
  • members:HashMapString,MemberMetadata类型,key是memberld,value是对应的MemberMetadata对象。
  • state:GroupState类型,标识当前Consumer Group所处的状态。
  • generationld:标识当前Consumer Group的年代信息,避免受到过期请求的影响。
  • leaderld:记录Consumer Group中的Leader消费者的memberld。
  • protocol:记录了当前Consumer Group选择的ParitionAssignor。
    在GroupMetadata中提供了对上述字段的操作,例如对members集合的增删、对state的切换。GroupMetadata在进行Member的增删操作时,还会顺便选择Group Leader:
相关推荐
珠***格1 小时前
Ⅱ型边缘网关|易部署、易扩容、易改造
大数据·人工智能·分布式·能源·边缘计算
无心水2 小时前
17、本地多模态|Qwen-VL离线私有化提取敏感PDF完全指南
人工智能·分布式·架构·openclaw·hermes
Solis程序员3 小时前
分布式 SingleFlight:从单机请求合并到集群级远程调用去重
分布式
填满你的记忆4 小时前
Kafka 面试题 Top40
分布式·kafka
oqX0Cazj24 小时前
Go-Zero数据库事务实战:本地事务+失败自动回滚+生产避坑+简单分布式事务方案
数据库·分布式·golang
团象科技4 小时前
出海技术团队分布式落地调研 海外云团队协作开发实操记录
分布式
段一凡-华北理工大学4 小时前
工业领域的Hadoop架构学习~系列文章22:Hadoop生态展望 - 面向未来的技术演进
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
snow@li4 小时前
RabbitMQ:详解(2026版)/ 基于 AMQP 协议的消息中间件
分布式·rabbitmq
北京阿尔泰科技厂家4 小时前
长距离分布式采集的新选择——NET9770系列以太网同步数据采集卡技术应用解析
分布式·以太网·传感器·信号采集·数据采集卡·自动化控制·工业测试测量
七夜zippoe4 小时前
DolphinDB分布式计算:MapReduce模
大数据·分布式·mapreduce·dolphindb·计算