保证Kafka消息有序性

一、Kafka特性

  1. 写入同一个partion分区中的数据是一定有顺序的
  2. kafka中一个消费者消费一个partion的数据,消费者取出数据时,也是有顺序的

二、保证消息Kafka消息有序性

  1. 在生产者端,应保证消息被写入同一分区。可以在构造消息时指定消息的key
java 复制代码
producer.send(new ProducerRecord<>(topic, "order", msg))

ProducerRecord 对象。

(1)指明 partition 的情况下,直接将指明的值直接作为 partiton 值;

(2)没有指明 partition 值但有 key 的情况下,将 key 的 hash 值与 topic 的 partition数进行取余得到 partition 值;在Producer往Kafka插入数据时,控制同一Key分发到同一Partition ,并且设置参数max.in.flight.requests.per.connection=1,也即同一个链接只能发送一条消息,如此便可严格保证Kafka消息的顺序

(3)既没有 partition 值又没有 key 值的情况下,第一次调用时随机生成一个整数(后面每次调用在这个整数上自增),将这个值与 topic 可用的 partition 总数取余得到 partition值,也就是常说的 round-robin 算法。

  1. 在消费者端,需要被顺序处理的消息让同一线程顺序处理

可以在消费者中,消息分发至不同的线程时,加一个队列,消费者去做hash分发,将需要放在一起的数据,分发至同一个队列中 ,最后多个线程从队列中取数据,如下图所示。

参考文献:https://mp.weixin.qq.com/s?__biz=MzAxMjY5NDU2Ng==\&mid=2651863959\&idx=1\&sn=4f1699d1740490046450f5d2121424c6\&chksm=80497edeb73ef7c833ce889e89b5b2f6f2f479f6144164b35c8bd34e94214adf436e50b45c03\&scene=27

相关推荐
无限大.5 分钟前
为什么“缓存“能提高系统性能?——从 CPU 缓存到分布式缓存
分布式·缓存
迪迦不喝可乐9 分钟前
Kafka
分布式·kafka
心态还需努力呀9 分钟前
从单体到分布式:一套 Pulsar 驱动的 AI Infra 实战框架
人工智能·分布式
Akamai中国13 分钟前
分布式边缘推理正在改变一切
人工智能·分布式·云计算·云服务
毕设源码-钟学长19 分钟前
【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案
大数据·hadoop·分布式
无心水22 分钟前
【分布式利器:腾讯TSF】2、腾讯微服务框架TSF实战指南:Spring Boot零侵入接入与容器化部署全流程
java·spring boot·分布式·微服务·springcloud·分布式利器·腾讯tsf
霍格沃兹测试开发学社测试人社区22 分钟前
Playwright测试策略:顺序、并行及分布式执行方案
分布式·自动化·playwright
ai_xiaogui41 分钟前
从实体转行到本地AI:AIStarter 完美收官,Panelai 开启分布式算力管理新篇章
人工智能·分布式
予枫的编程笔记1 小时前
Elasticsearch 全面解析:从原理到实战的分布式搜索引擎指南
java·开发语言·分布式·后端·elasticsearch·搜索引擎·全文检索
凹凸曼说我是怪兽y3 小时前
Redis分布式锁详细实现演进与Redisson深度解析
数据库·redis·分布式