目录
背景:
最近面试总是被问这个问题,然后总感觉答得不好就写博客总结一下,可以先看总结
原理:
Kafka 中,同一个分区内的消息是按照写入顺序依次存储的,并且每条消息都有一个递增的 offset。因此:
- 只要生产者按顺序发送
- 消费者按顺序读取
就可以保证这个分区里的消息是有序的
情况一:如果只有一个分区
如果 Topic 只有一个分区,那么我们只需要配置一个消费者去顺序地消费这个分区,就可以天然保证消息顺序性。 这是最简单、最直接的顺序消费方式。
情况二:如果有多个分区
多个分区的情况下,我们通常需要做两件事:
1. 使用 Key + 分区策略,让"同一类消息"发送到同一个分区
- 所谓"同一类消息",指的是那些你希望它们保持顺序的一组消息。
- 比如说:我们只要求"同一个用户"的消息是有序的,而不同用户之间没关系。
- 那么可以通过用户 ID 做 Hash 或取余,将相同用户的消息分配到同一个分区中。
这样就保证了"同一用户的消息"都落在同一个 Partition 上,具备了 顺序性保障的基础条件。
2. 保证同一分区的消息是串行写入 + 串行消费 - 发送端
要确保写入同一分区的消息是按顺序串行发出的,不能并发打乱顺序。 - 消费端
则要保证每个分区只由一个线程、协程或消费者去消费,这样消费逻辑才是串行的。
总结
Kafka 只保证" 每个分区内"消息的顺序性。如果你想让某类消息保持顺序,就必须做到:
✅ 把这些消息发到同一个分区(通过 Key 控制)
✅ 串行写入这些消息
✅ 串行消费这个分区