Kafka 消息有序性问题
业务场景
在某些场景下,需要保证消息的有序性,比如同一个账号的买票退票改签信息,但是当此主题下有多个分区时,往往不能保证其有序性。
原因分析
当 kafka 的一个 topic 存在多个 partition 时,是无法保证数据的顺序性的,但是同一个 partition 中的数据是有顺序的。
技术建议
我们来回顾 kafka 的基础结构:
- kafka 的消息组织方式是三级结构:主题-分区(副本)-消息。主题下的每条消息只会保存在某一份分区中,不会在多个分区中保存多份。
- 分区是实现负载均衡以及高吞吐量的关键。
- 常见分区策略:轮询、随机、按消息键保序。
- 消息重试时不会换分区,只是简单地将消息重新发送到之前的分区。
解决方案
保证同一批因果依赖的消息分到一个分区,在此案例中就是将同一个账号的操作信息都发往一个分区。