kafka的工作原理与常见问题

定义

kafka是一个分布式的基于发布/订阅模式的消息队列(message queue),主要应用于大数据的实时处理领域
消息队列工作原理

kafka的组成结构

kafka的基础架构主要有broker、生产者、消费者组构成,还包括zookeeper.

生产者负责发送消息

broker负责缓冲 消息,存储在磁盘的,所以数据不易丢失,broker中可以创建topic,每个topic又有partition和replication的概念

消费者组负责处理 消息,同一个消费者组的中消费者不能消费同一个partition中的数据

Kakfa如果要组件集群,则只需要注册到一个zk中就可以了,zk中还保留消息消费的进度或者说偏移量或者消费位置

工作流程

1)主线程首先将业务数据封装成ProducerRecord对象

2)调用send方法将消息放入消息收集器RecordAccumlator中暂存

3)Sender线程将消息信息构成请求

4)执行网络IO的线程从RecordAccumlator中将消息取出并批量发送出去

5)Kafka消费者从属于消费者组。消费者组内的消费者订阅的是相同主题,每个消费者接收主题的一部分分区的消息。

常见问题

1:kafka如何保证消息的顺序性?

Kafka 保证消息顺序性是指在单个分区内消息是有序的,即消费者从一个分区中读取消息时,这些消息是按照生产者发送的顺序来消费的。

为了保证消息的顺序性,你需要确保以下几点:
生产者将消息发送到同一个分区
不要并发写入同一个分区,否则可能会导致消息乱序。

消费者从分区中读取消息是按按顺序的并按顺序处理,保证了消息的顺序性。

2:kafka 生产者发送消息时如何来提高发送速率

要提高Kafka生产者的发送速率,可以调整Kafka生产者客户端的几个关键配置参数:

batch.size: 控制生产者一起发送数据的大小,默认是16KB。增加这个值可以批量发送更多的消息,从而提高发送速率。

linger.ms: 控制生产者发送数据之前等待更多消息加入到batch中的时间。降低这个值可以更快地发送小批量消息,默认值为0毫秒)。

max.request.size: 控制生产者能发送的最大消息大小。如果消息大小超过这个值,消息将会被截断。

buffer.memory: 控制生产者可以用来缓存消息的内存大小。增加这个值可以缓存更多的消息。

compression.type: 控制消息被压缩的方式,可以选择压缩类型来减少发送的数据量。

相关推荐
坤昱11 小时前
cfs调度类深入解刨——最新内核细节分析5
linux·分布式·cfs调度·eevdf调度·linux调度·linux技术·kernel最新版本内容
AI人工智能+电脑小能手11 小时前
【大白话说Java面试题 第91题】【Mysql篇】第21题:分布式锁的使用场景和原理?
java·数据库·分布式·mysql·面试
JAVA社区11 小时前
Java高级全套教程(十三)—— 分布式锁超详细实战详解(原理+三种方案企业级落地)
java·开发语言·分布式·spring cloud·面试·java-zookeeper
Leo18712 小时前
分布式事务
java·分布式·分布式事务
潮起鲸落入海15 小时前
ceph分布式存储认证和授权,块存储管理
分布式·ceph
张小凡vip15 小时前
Spring Boot集成Kafka完整版
spring boot·kafka·linq
ZPC821016 小时前
前馈补偿原理 + 分类 + 公式 + 工程实现(配合 PID 使用,从根源减轻闭环收敛压力)
人工智能·分布式·机器人
Devin~Y16 小时前
智慧物流+AIGC客服Java大厂面试:Spring Boot、Kafka、Redis、JVM与RAG Agent实战
java·jvm·spring boot·redis·spring cloud·kafka·rag
闪电悠米16 小时前
黑马点评-分布式锁-02_simple_redis_lock_setnx
java·数据库·spring boot·redis·分布式·缓存·wpf
大迪deblog16 小时前
从分布式到中央计算:深度拆解下一代 Zonal 车载 EEA 架构变革
分布式·架构