一、Kafka特性
- 写入同一个partion分区中的数据是一定有顺序的
- kafka中一个消费者消费一个partion的数据,消费者取出数据时,也是有顺序的
二、保证消息Kafka消息有序性
- 在生产者端,应保证消息被写入同一分区。可以在构造消息时指定消息的key
java
producer.send(new ProducerRecord<>(topic, "order", msg))
ProducerRecord 对象。
(1)指明 partition 的情况下,直接将指明的值直接作为 partiton 值;
(2)没有指明 partition 值但有 key 的情况下,将 key 的 hash 值与 topic 的 partition数进行取余得到 partition 值;在Producer往Kafka插入数据时,控制同一Key分发到同一Partition ,并且设置参数max.in.flight.requests.per.connection=1,也即同一个链接只能发送一条消息,如此便可严格保证Kafka消息的顺序
(3)既没有 partition 值又没有 key 值的情况下,第一次调用时随机生成一个整数(后面每次调用在这个整数上自增),将这个值与 topic 可用的 partition 总数取余得到 partition值,也就是常说的 round-robin 算法。
- 在消费者端,需要被顺序处理的消息让同一线程顺序处理
可以在消费者中,消息分发至不同的线程时,加一个队列,消费者去做hash分发,将需要放在一起的数据,分发至同一个队列中 ,最后多个线程从队列中取数据,如下图所示。