[kafka]kafka如何保证消息有序

严格的说,kafka只能保证同一个分区内的消息存储的有序性。

这个问题并没有标准答案,面试官只是想看看你如何思考的。

1、kafka怎么保证消息的消费顺序。可以,但是代价太大了。

kafka只能保证单partition有序,如果kafka要保证多个partition有序,不仅broker保存的数据要保持顺序,消费时也要按序消费。假设partition1堵了,为了有序,那partition2以及后续的分区也不能被消费,这种情况下,kafka就退化成了单一队列,毫无并发性可言,极大降低系统性能。

因此kafka使用多partition的概念,并且只保证单partition有序。这样不同partition之间不会被干扰。

2、kafka保证消息顺序有2种方法

1)全局消费顺序:设置一个partition

2)局部消费顺序:多个partition局部有序

生产时:producer在把消息发送到partition的时候,当key非空时,用key的hash值对partition个数取模,决定要把消息发送到哪个partition上,可以指定一样的key,这样这个key的消息在单个partition内是有序的。

注:当key为空时,消息随机发送到各个分区。规则再各个版本会有不同,有的是采用轮询方式,有的随机,有的是一定时间内发送给固定的partition,隔一段时间后随机换一个。

消费时:在一个消费者组中的多个消费者消费一个topic时,一个消费这组中只能有一个消费者消费该消息,topic下的每个分区只属于组中的一个消费者,因此是有序的。

相关推荐
darkdragonking4 分钟前
OpenEuler 22.03 不依赖zookeeper安装 kafka 3.3.2集群
kafka
ProtonBase6 分钟前
如何从 0 到 1 ,打造全新一代分布式数据架构
java·网络·数据库·数据仓库·分布式·云原生·架构
时时刻刻看着自己的心10 分钟前
clickhouse分布式表插入数据不用带ON CLUSTER
分布式·clickhouse
Data跳动9 小时前
Spark内存都消耗在哪里了?
大数据·分布式·spark
Java程序之猿10 小时前
微服务分布式(一、项目初始化)
分布式·微服务·架构
来一杯龙舌兰11 小时前
【RabbitMQ】RabbitMQ保证消息不丢失的N种策略的思想总结
分布式·rabbitmq·ruby·持久化·ack·消息确认
节点。csn13 小时前
Hadoop yarn安装
大数据·hadoop·分布式
saynaihe13 小时前
安全地使用 Docker 和 Systemctl 部署 Kafka 的综合指南
运维·安全·docker·容器·kafka
NiNg_1_23414 小时前
基于Hadoop的数据清洗
大数据·hadoop·分布式
隔着天花板看星星15 小时前
Spark-Streaming集成Kafka
大数据·分布式·中间件·spark·kafka