kafka主题,分区,副本,节点几个概念理解

kafka相关概念

一、相关概念

  • 主题:类似于数据库中的表,用于存放生产者的数据
  • 分区:类似于数据库的中分表,将一个主题分成多个分区(一个大表分成多个分表)
  • 节点:kafka数量,或者理解为kafka集群服务器节点数量
  • 副本:相当于对分区的一个备份,这个值小于等于节点数量
  • 消费者组:消费同一类主题的多个消费者

kafka集群中:

如果所有主题配置的是1个副本。当一个节点挂了之后,其他节点无法正常消费。

如果只有doorinout主题副本是二个,当一个节点挂了后,其他节点无法正常消费。

如果__consumer_offsets主题副本是2个,doorinout主题副本是二个,当一个节点挂了后,其他节点除doorinout主题外,其他主题无法消费。

Broker123 为三个不同的节点

topic为主题1,分成了3个分区,3个副本。

bash 复制代码
./bin/kafka-topics.sh --describe --zookeeper 172.16.10.201:2181 --topic myTopic

Topic:myTopic PartitionCount:3 ReplicationFactor:3 Configs:

Topic: myTopic Partition: 0 Leader: 2 Replicas: 2,3,1 Isr: 2,3,1

Topic: myTopic Partition: 1 Leader: 3 Replicas: 3,1,2 Isr: 3,1,2

Topic: myTopic Partition: 2 Leader: 1 Replicas: 1,2,3 Isr: 1,2,3

myTopic中,PartitionCount:3 (分区为3)ReplicationFactor:3 (副本为3)

leader为分区的leader所在的节点。分区0分散在三个副本上,三个副本分散在三个节点上。其他主题分区的副本也都散落在不同的 Broker 上,从而实现数据冗余。

  • AR:Kafka 分区中的所有副本统称为 AR(Assigned Repllicas)
  • ISR:表示和 Leader 保持同步的 Follower 集合。 如果 Follower 长时间未向 Leader 发送通信请求或同步数据,则该 Follower 将被踢出 ISR。 该时间阈值由 replica.lag.time.max.ms参数设定,默认 30s。 Leader 发生故障之后,就会从 ISR 中选举新的 Leader。
  • OSR:表示 Follower 与 Leader 副本同步时,延迟过多的副本

AR = ISR + OSR

相关推荐
ACP广源盛139246256731 小时前
IX7008 PCIe 交换芯片@ACP#RTX Spark 经济型 8 口扩展芯片(对比 ASM1806)
大数据·人工智能·分布式·嵌入式硬件·gpt·spark·电脑
ACP广源盛139246256732 小时前
IX6012 PCIe 交换芯片@ACP#RTX Spark 入门级 12 口存储外设扩展方案(对比 ASM1812)
大数据·人工智能·分布式·嵌入式硬件·gpt·spark·电脑
开开心心就好3 小时前
解决截图被拦截黑屏问题的免费小工具
安全·智能手机·flink·kafka·pdf·音视频·1024程序员节
分布式存储与RustFS3 小时前
对标MinIO!RustFS新一代AI分布式对象存储开源能力前瞻
人工智能·分布式·开源·分布式对象存储·rustfs·minio平替·s3 table
cxr8285 小时前
蜂群智能系统中“非必要不添加“原则的有效性再审视:基于分布式决策与通信复杂度的理论推导
人工智能·分布式·智能体
bIo7lyA8v5 小时前
算法工程中的可扩展性与分布式实现方案的技术8
分布式
我登哥MVP5 小时前
SpringCloud 核心组件解析:分布式配置管理
java·spring boot·分布式·spring·spring cloud·java-ee·maven
IT策士5 小时前
Redis 从入门到精通:分布式锁 —— 从 SETNX 到 Redlock
数据库·redis·分布式
linux修理工6 小时前
kafka积压
数据库·分布式·kafka
杰克逊的日记6 小时前
kafka消息堆积了怎么处理
大数据·分布式·kafka