Kafka 3.9.1的KRaft模式部署

一、核心架构与角色
  1. KRaft 模式特点
    • 去中心化:移除 ZooKeeper,元数据由 Kafka 集群内部管理。
    • Raft 协议:通过 Raft 实现元数据一致性,控制器(Controller)节点组成仲裁(Quorum)处理元数据变更。
    • 角色分离:Broker 负责消息存储,Controller 负责元数据管理,两者可独立部署或合并运行(Combined 模式)。
  2. 节点类型
    • Broker:存储消息数据,处理生产/消费请求。
    • Controller:管理元数据(如 Topic、分区、副本状态),参与 Raft 选举。
    • Combined 模式:单节点同时运行 Broker 和 Controller(适用于开发环境,生产环境不推荐)。
二、关键配置参数

以下配置需在 server.properties 文件中设置:

参数 说明 示例值
process.roles 节点角色,可选 brokercontroller 或两者组合(如 broker,controller)。 broker,controller(生产环境推荐分离部署)
node.id 节点唯一标识,需在集群内唯一。 1(Controller 节点)、2(Broker 节点)
controller.quorum.voters Controller 仲裁列表,格式为 {id}@{host}:{port} 1@controller1:9093,2@controller2:9093,3@controller3:9093
listeners 监听地址,需包含 PLAINTEXT(Broker)和 CONTROLLER(内部通信)。 PLAINTEXT://:9092,CONTROLLER://:9093
advertised.listeners 对外暴露的 Broker 地址(客户端连接地址)。 PLAINTEXT://192.168.1.100:9092
controller.listener.names Controller 监听器名称(固定为 CONTROLLER)。 CONTROLLER
log.dirs 数据存储目录(建议独立磁盘)。 /data/kafka/logs
inter.broker.listener.name Broker 间通信使用的监听器名称(需与 listeners 一致)。 PLAINTEXT

单机本地KRaft模式完整示例

bash 复制代码
broker.id=0
listeners=PLAINTEXT://localhost:9092,CONTROLLER://0.0.0.0:9093
listener.security.protocol.map=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT

process.roles=broker,controller
controller.quorum.voters=0@localhost:9093
# controller.quorum.voting.mode=round-robin
controller.listener.names=CONTROLLER


advertised.listeners=PLAINTEXT://localhost:9092
三、配置步骤
  1. 生成集群 ID

    使用 kafka-storage.sh 工具生成唯一集群 ID:

    bash 复制代码
    bin/kafka-storage.sh random-uuid

    输出示例:4hU1sxPUQG-4qqqgZQxFZA(需记录并用于后续格式化)。

  2. 格式化存储目录

    在所有节点上执行格式化,指定集群 ID 和配置文件:

    bash 复制代码
    bin/kafka-storage.sh format -t <CLUSTER_ID> -c config/kraft/server.properties
  3. 启动服务

    • 单节点(Combined 模式)

      bash 复制代码
      bin/kafka-server-start.sh config/kraft/server.properties
    • 多节点集群
      按角色分别启动 Controller 和 Broker 服务(建议使用 systemd 管理进程)。

  4. 验证集群状态

    • 检查 Broker 列表:

      bash 复制代码
      bin/kafka-broker-api-versions.sh --bootstrap-server <BROKER_IP>:9092
    • 查看 Controller 状态:

      bash 复制代码
      bin/kafka-metadata-quorum.sh describe --bootstrap-server <BROKER_IP>:9092
四、生产环境最佳实践
  1. Controller 节点配置
    • 数量 :建议 3 或 5 个节点(奇数),容忍 (n-1)/2 个节点故障。
    • 资源隔离:与 Broker 分离部署,避免资源竞争。
    • 网络优化:使用低延迟、高带宽网络(如万兆网卡)。
  2. Broker 节点配置
    • 副本数default.replication.factor=3(兼顾可用性与存储成本)。
    • 消息压缩 :启用 compression.type=lz4zstd 减少网络开销。
    • JVM 调优 :设置 KAFKA_HEAP_OPTS="-Xmx8G -Xms8G",启用 G1 垃圾回收器。
  3. 监控与运维
    • 关键指标:Controller 选举耗时、元数据复制延迟、Broker 磁盘 I/O。
    • 日志管理 :定期清理旧日志(log.retention.hours=168)。
五、常见问题解决
  1. No security protocol defined for listener CONTROLLER

    • 原因 :未配置 CONTROLLER 监听器的安全协议。

    • 解决 :在 server.properties 中添加:

      bash 复制代码
      listener.security.protocol.map=CONTROLLER:PLAINTEXT,PLAINTEXT:PLAINTEXT
  2. 客户端连接失败

    • 检查项
      • advertised.listeners 是否为客户端可访问的 IP 或域名。
      • 防火墙是否开放 9092(Broker)和 9093(Controller)端口。
  3. 元数据不一致

    • 场景:Controller 选举失败或网络分区。
    • 处理 :检查 kafka-metadata-quorum.sh 输出,确认 Leader 和 Voters 状态。
相关推荐
阿里云云原生1 天前
数据链路再精简:Kafka 如何做到“零 ETL”一键写入 Apache Iceberg?
kafka
阿里云云原生7 天前
告别冗长链路!Kafka × Table Bucket 实现开放表格式零 ETL 实时入湖
云原生·kafka
风吹夏回13 天前
RabbitMQ 核心术语 + Python pika 方法完整讲解
分布式·python·rabbitmq
风吹夏回13 天前
RabbitMQ 三种模式入门:HelloWorld、WorkQueue、PubSub
分布式·rabbitmq·ruby
霸道流氓气质13 天前
分布式追踪与 RequestId 传播完全指南
分布式
cheems952713 天前
[RabbitMQ高级特性] 消息确认机制:从 Ready / Unacked 到 basicAck、basicReject、basicNack 的底层拆解
分布式·rabbitmq·ruby
whaledown13 天前
Kafka 与 Java 消息队列入门:用订单场景理解核心机制
java·kafka·消息队列·springboot
枫华落尽13 天前
【Hadoop01-完全分布式运行模式】
分布式
隔壁阿布都13 天前
ShedLock 分布式定时任务锁框架介绍
spring boot·分布式
文艺倾年13 天前
【强化学习】数学推导专题,20W字总结(十五)
人工智能·分布式·大模型·强化学习·vibecoding