【kafka系列】broker

目录

[Broker 接收生产者消息和返回消息给消费者的流程逻辑分析](#Broker 接收生产者消息和返回消息给消费者的流程逻辑分析)

[Broker 处理生产者消息的核心流程](#Broker 处理生产者消息的核心流程)

[Broker 处理消费者消息的核心流程](#Broker 处理消费者消息的核心流程)

关键点总结


Broker 接收生产者消息和返回消息给消费者的流程逻辑分析


Broker 处理生产者消息的核心流程
  1. 接收请求
    • Broker 的 SocketServer 接收来自生产者的 ProduceRequest(基于 Reactor 网络模型)。
  1. 请求解析与验证
    • 解析请求头(Topic、Partition、消息数据)。
    • 验证 Topic 是否存在、生产者是否有写入权限(ACL/SASL)。
  1. 定位 Leader 副本
    • 根据 Partition ID 找到对应的 Leader 副本(元数据存储在内存或 KRaft/ZooKeeper)。
  1. 写入日志文件
    • 消息以顺序追加 方式写入 Leader 副本的 Log 文件(.log),并更新索引文件(.index)。
  1. 副本同步(ISR 机制)
    • Leader 将消息推送给 ISR(In-Sync Replicas)列表中的 Follower 副本。
    • 若 Follower 副本同步超时(replica.lag.time.max.ms),会被移出 ISR。
  1. 响应生产者
    • 根据 acks 配置返回响应:
      • acks=0:不等待确认,直接返回成功。
      • acks=1:等待 Leader 写入完成。
      • acks=all:等待所有 ISR 副本确认。

设计思想

  • 高吞吐:顺序 I/O + 页缓存(Page Cache)优化写入性能。
  • 可靠性:ISR 机制保证数据冗余,避免单点故障。

Broker 处理消费者消息的核心流程
  1. 接收请求
    • Broker 的 SocketServer 接收消费者的 FetchRequest(指定 Topic、Partition、Offset)。
  1. 请求解析与验证
    • 验证消费者权限、Offset 有效性(是否在 Log 的保留范围内)。
  1. 定位 Leader 副本
    • 确认消费者请求的 Partition Leader 副本所在 Broker(若当前 Broker 不是 Leader,返回错误)。
  1. 读取日志文件
    • 根据 Offset 从 Log 文件中定位消息位置,利用索引文件(.index)快速查找。
  1. 零拷贝发送
    • 使用 sendfile 系统调用,直接从页缓存(Page Cache)发送数据到网络,避免用户态内存拷贝。
  1. 返回响应
    • 封装消息数据到 FetchResponse,包含实际 Offset、消息内容及元数据。

设计思想

  • 低延迟:零拷贝技术减少 CPU 和内存开销。
  • 高效读取:稀疏索引(Sparse Index)快速定位消息位置。

关键点总结

  1. 生产者写入
    • 强依赖 Leader 副本和 ISR 机制保障数据一致性。
    • acks 配置直接影响可靠性和延迟。
  1. 消费者读取
    • 零拷贝技术是 Kafka 高吞吐的关键。
    • Offset 有效性检查防止读取过期或不存在的数据。
  1. Broker 角色
    • 同时承担 Leader 和 Follower 副本的读写协调。
相关推荐
2401_8747325319 分钟前
为你的Python脚本添加图形界面(GUI)
jvm·数据库·python
Chengbei111 小时前
Redis 图形化综合检测工具:redis_tools_GUI,一键探测 + 利用
数据库·redis·web安全·网络安全·缓存·系统安全
hutengyi1 小时前
PostgreSQL的备份方式
数据库·postgresql
mldlds2 小时前
MySQL加减间隔时间函数DATE_ADD和DATE_SUB的详解
android·数据库·mysql
Chengbei112 小时前
若依全漏洞复现:从 SQL 注入到 RCE 一站式实战 复现、利用与防御
数据库·sql·安全·web安全·网络安全·系统安全·安全架构
小江的记录本2 小时前
【事务】Spring Framework核心——事务管理:ACID特性、隔离级别、传播行为、@Transactional底层原理、失效场景
java·数据库·分布式·后端·sql·spring·面试
数据皮皮侠3 小时前
中国城市间地理距离矩阵(2024)
大数据·数据库·人工智能·算法·制造
lars_lhuan3 小时前
从键值数据库到Redis
数据库·redis·缓存
倔强的石头1063 小时前
KaiwuDB社区版 3.1.0 在 Ubuntu 22.04 部署实战:TLS 配置、踩坑复盘与轻量压测
数据库·ubuntu·kwdb