1.Kafka-快速认识概念

快速认识概念

Broker

是Kafka的服务端程序,可以简单的认为一个MQ节点就是一个Broker。

Broker存储Topic的数据。

Producer生产者

创建消息Message,发送到MQ中。这个角色把消息发布到Kafka的Topic中。

Consumer消费者

消费队列里面的消息。

ConsumerGroup消费者组

同个topic, 广播发送给不同的group,一个group中只有一个consumer可以消费此消息。

Topic

每条发到Kafka集群的消息都会有一个主题,也就是Topic。

Partition分区

kafka数据存储的基本单元,topic中的数据分割为一个或多个partition,每个topic至少有一个partition,是有序的。一个Topic的多个partitions, 被分布在kafka集群中的多个server上。

PS:消费者数量 <= Partition数量

Replication 副本(备胎)

同个Partition会有多个副本replication ,多个副本的数据是一样的,当其他broker挂掉后,系统可以主动用副本提供服务。

默认每个topic的副本都是1(默认是没有副本,节省资源),也可以在创建topic的时候指定

如果当前kafka集群只有3个broker节点,则replication-factor最大就是3了,如果创建副本为4,则会报错

ReplicationLeader、ReplicationFollower

负责Broker所有分区副本信息,Replication 副本状态切换。

ReplicationManager

Partition有多个副本,但只有一个replicationLeader负责该Partition和生产者消费者交互。

ReplicationFollower只是做一个备份,从replicationLeader进行同步。

offset

每个consumer实例需要为他消费的partition维护一个记录自己消费到哪里的偏移offset,kafka把offset保存在消费端的消费者组里

三剑客的架构图

下面来看一下我简单画的架构图。

Broker、Topic和Patition的关系

类比数据库!Broker可以看作数据库,Topic可以看作数据库的表,Patition可以看作分表。

Patition、Consumer Group和Consumer的关系

Consumer Group下订阅的topic的每个Patition只能分配给某个Group下的某个Consumer。不允许同组有多个Consumer进行消费。该Patition可以分配给其他的Group的Consumer,同样只能Group内只能有一个Consumer进行消费。

特点总结

**多订阅者:**一个topic可以有一个或者多个订阅者,每个订阅者都要有一个partition,所以订阅者数量要少于等于partition数量

**高吞吐量、低延迟:**每秒可以处理几十万条消息

**高并发:**几千个客户端同时读写

**容错性:**多副本、多分区,允许集群中节点失败,如果副本数据量为n,则可以n-1个节点失败

**扩展性强:**支持热扩展

基于消费者组可以实现:

**基于队列的模型:**所有消费者都在同一消费者组里,每条消息只会被一个消费者处理

**基于发布订阅模型:**消费者属于不同的消费者组,假如每个消费者都有自己的消费者组,这样kafka消息就能广播到所有消费者实例上

相关推荐
也些宝2 小时前
Java单例模式:饿汉、懒汉、DCL三种实现及最佳实践
java
Nyarlathotep01133 小时前
SpringBoot Starter的用法以及原理
java·spring boot
wuwen53 小时前
WebFlux + Lettuce Reactive 中 SkyWalking 链路上下文丢失的修复实践
java
SimonKing3 小时前
GitHub 10万星的OpenCode,正在悄悄改变我们的工作流
java·后端·程序员
Seven974 小时前
虚拟线程深度解析:轻量并发编程的未来趋势
java
雨中飘荡的记忆14 小时前
ElasticJob分布式调度从入门到实战
java·后端
考虑考虑1 天前
JDK25模块导入声明
java·后端·java ee
_小马快跑_1 天前
Java 的 8 大基本数据类型:为何是不可或缺的设计?
java
Re_zero1 天前
线上日志被清空?这段仅10行的 IO 代码里竟然藏着3个毒瘤
java·后端