【kafka系列】broker

目录

[Broker 接收生产者消息和返回消息给消费者的流程逻辑分析](#Broker 接收生产者消息和返回消息给消费者的流程逻辑分析)

[Broker 处理生产者消息的核心流程](#Broker 处理生产者消息的核心流程)

[Broker 处理消费者消息的核心流程](#Broker 处理消费者消息的核心流程)

关键点总结


Broker 接收生产者消息和返回消息给消费者的流程逻辑分析


Broker 处理生产者消息的核心流程
  1. 接收请求
    • Broker 的 SocketServer 接收来自生产者的 ProduceRequest(基于 Reactor 网络模型)。
  1. 请求解析与验证
    • 解析请求头(Topic、Partition、消息数据)。
    • 验证 Topic 是否存在、生产者是否有写入权限(ACL/SASL)。
  1. 定位 Leader 副本
    • 根据 Partition ID 找到对应的 Leader 副本(元数据存储在内存或 KRaft/ZooKeeper)。
  1. 写入日志文件
    • 消息以顺序追加 方式写入 Leader 副本的 Log 文件(.log),并更新索引文件(.index)。
  1. 副本同步(ISR 机制)
    • Leader 将消息推送给 ISR(In-Sync Replicas)列表中的 Follower 副本。
    • 若 Follower 副本同步超时(replica.lag.time.max.ms),会被移出 ISR。
  1. 响应生产者
    • 根据 acks 配置返回响应:
      • acks=0:不等待确认,直接返回成功。
      • acks=1:等待 Leader 写入完成。
      • acks=all:等待所有 ISR 副本确认。

设计思想

  • 高吞吐:顺序 I/O + 页缓存(Page Cache)优化写入性能。
  • 可靠性:ISR 机制保证数据冗余,避免单点故障。

Broker 处理消费者消息的核心流程
  1. 接收请求
    • Broker 的 SocketServer 接收消费者的 FetchRequest(指定 Topic、Partition、Offset)。
  1. 请求解析与验证
    • 验证消费者权限、Offset 有效性(是否在 Log 的保留范围内)。
  1. 定位 Leader 副本
    • 确认消费者请求的 Partition Leader 副本所在 Broker(若当前 Broker 不是 Leader,返回错误)。
  1. 读取日志文件
    • 根据 Offset 从 Log 文件中定位消息位置,利用索引文件(.index)快速查找。
  1. 零拷贝发送
    • 使用 sendfile 系统调用,直接从页缓存(Page Cache)发送数据到网络,避免用户态内存拷贝。
  1. 返回响应
    • 封装消息数据到 FetchResponse,包含实际 Offset、消息内容及元数据。

设计思想

  • 低延迟:零拷贝技术减少 CPU 和内存开销。
  • 高效读取:稀疏索引(Sparse Index)快速定位消息位置。

关键点总结

  1. 生产者写入
    • 强依赖 Leader 副本和 ISR 机制保障数据一致性。
    • acks 配置直接影响可靠性和延迟。
  1. 消费者读取
    • 零拷贝技术是 Kafka 高吞吐的关键。
    • Offset 有效性检查防止读取过期或不存在的数据。
  1. Broker 角色
    • 同时承担 Leader 和 Follower 副本的读写协调。
相关推荐
喝醉酒的小白36 分钟前
MySQL响应慢是否由堵塞或死锁引起?
数据库
Pasregret38 分钟前
04-深入解析 Spring 事务管理原理及源码
java·数据库·后端·spring·oracle
jnrjian1 小时前
归档重做日志archived log (明显) 比redo log重做日志文件小
数据库·oracle
TDengine (老段)1 小时前
TDengine 中的命名与边界
大数据·数据库·物联网·oracle·时序数据库·tdengine·iotdb
纪元A梦1 小时前
分布式锁算法——基于ZooKeeper的分布式锁全面解析
java·分布式·算法·zookeeper
小样vvv2 小时前
【分布式】Hystrix 的核心概念与工作原理
分布式·hystrix
谁家有个大人2 小时前
MYSQL中对行与列的操作
数据库·mysql
0000ysl2 小时前
数据库基础-函数&约束
数据库
JavaPub-rodert3 小时前
Etcd用的是Raft算法
数据库·github·etcd·raft
编程乐趣3 小时前
FlexLabs.Upsert:EF Core插件推荐,支持多数据库的Upsert功能
数据库