Kafka 消息有序性问题

Kafka 消息有序性问题

业务场景

在某些场景下,需要保证消息的有序性,比如同一个账号的买票退票改签信息,但是当此主题下有多个分区时,往往不能保证其有序性。

原因分析

当 kafka 的一个 topic 存在多个 partition 时,是无法保证数据的顺序性的,但是同一个 partition 中的数据是有顺序的。

技术建议

我们来回顾 kafka 的基础结构:

  • kafka 的消息组织方式是三级结构:主题-分区(副本)-消息。主题下的每条消息只会保存在某一份分区中,不会在多个分区中保存多份。
  • 分区是实现负载均衡以及高吞吐量的关键。
  • 常见分区策略:轮询、随机、按消息键保序。
  • 消息重试时不会换分区,只是简单地将消息重新发送到之前的分区。

解决方案

保证同一批因果依赖的消息分到一个分区,在此案例中就是将同一个账号的操作信息都发往一个分区。

相关推荐
IIIIIILLLLLLLLLLLLL8 小时前
Hadoop集群时间同步方法
大数据·hadoop·分布式
回家路上绕了弯14 小时前
大表优化实战指南:从千万到亿级数据的性能蜕变
分布式·后端
杀死那个蝈坦14 小时前
MyBatis-Plus 使用指南
java·kafka·tomcat·mybatis—plus
CrazyClaz15 小时前
分布式事务专题5
分布式·分布式事务
灯下夜无眠16 小时前
spark集群文件分发问题
大数据·分布式·spark
少许极端16 小时前
Redis入门指南:从零到分布式缓存-string类型
redis·分布式·缓存
Macbethad17 小时前
WPF工业设备诊断管理程序技术方案
大数据·hadoop·分布式
Thomas214318 小时前
pyspark3.5给paimon1.2的表打tag报错 spark_catalog is not a ProcedureCatalog
大数据·分布式·spark
稚辉君.MCA_P8_Java18 小时前
Gemini永久会员 Hadoop分布式计算框架MapReduce
大数据·hadoop·分布式·架构·mapreduce
CrazyClaz19 小时前
分布式事务专题4
分布式·分布式事务