kafka和rocketmq区别对比

Kafka和RocketMQ是目前非常流行的分布式消息系统，它们都能够高效地处理海量的消息数据。在本文中，我们将对Kafka和RocketMQ进行技术比较，分析它们在各方面的优缺点，以便读者在选择消息系统时能够做出更加明智的决策。

一、架构设计

Kafka和RocketMQ都是基于发布/订阅模式的消息系统，但是它们的架构设计有所不同。

Kafka的架构设计比较简单，主要由生产者、消费者和Kafka集群三个组件组成。生产者将消息发布到Kafka集群中的Broker节点，然后消费者从Broker节点中获取消息进行消费。Kafka的数据模型是基于Topic和Partition的，每个Topic可以有多个Partition，每个Partition可以在多个Broker节点上复制，保证数据的高可用性。

RocketMQ的架构设计比较复杂，主要由Namesrv、Broker和Producer/Consumer三个角色组成。Namesrv主要负责服务注册和发现，Broker节点负责存储和传输消息，Producer和Consumer分别将消息发送到和从Broker节点中获取消息。RocketMQ也是基于Topic和Partition的数据模型，但它采用了一种主从复制的机制，确保了数据的高可用性和容错性。

二、性能比较

Kafka和RocketMQ都是高吞吐、低延迟的消息系统，但是它们的性能也有所差异。

在吞吐量方面，Kafka表现更加出色。Kafka使用顺序写磁盘的方式存储消息，因此可以达到非常高的写入吞吐量，而且在读取方面也能够达到非常高的性能。RocketMQ虽然也使用了顺序写磁盘的方式存储消息，但是其读取性能稍逊于Kafka，尤其是在批量拉取消息的情况下。

在延迟方面，RocketMQ表现更加出色。RocketMQ通过采用Zero Copy技术和缓存池技术来降低延迟，而Kafka则通过批量发送和异步处理的方式来提高吞吐量，但相应的会增加一定的延迟。

三、可靠性比较

Kafka和RocketMQ都是高可靠性的消息系统，但是它们的可靠性也有所不同。

在数据可靠性方面，Kafka表现更加出色。Kafka采用了多副本机制，每个Partition都有多个副本，当某个Broker节点失效时，可以通过其他副本来保证数据的可用性。而RocketMQ采用的是主从复制机制，当主节点失效时，需要进行主节点选举才能保证数据的可用性，这可能会导致一定的延迟。

在数据一致性方面，Kafka也具有更好的表现。Kafka采用了基于Zookeeper的分布式协调机制，能够确保数据在Producer和Consumer之间的顺序性。而RocketMQ则需要在Producer端对消息进行排序，然后再发送到Broker节点中，这可能会对性能造成一定的影响。

在消息事务方面，RocketMQ的表现要优于Kafka。RocketMQ提供了完整的消息事务机制，能够保证消息在发送和接收过程中的一致性和可靠性。而Kafka并没有提供官方的事务支持，需要开发者自行处理。

在故障恢复方面，Kafka具有更好的表现。Kafka支持自动的故障转移和数据复制机制，能够快速地恢复节点的可用性，保证数据的连续性。而RocketMQ需要手动进行主从切换，可能需要一定的人工干预。

综上所述，Kafka和RocketMQ在可靠性方面都有其优劣之处，选择哪一个更适合，需要根据具体的应用场景和需求进行评估

原文链接：https://blog.csdn.net/hb13262736769/article/details/130114126

为什么kafka延迟比rocketmq延迟高

说kafka延迟比rocketmq延迟高是有一个前提的就是topic较多的时候这个和这2个MQ的数据存储结构有关系的在topic少的时候延迟基本一致。

kafka的数据存储结构设计师尽可能的保证吞吐量，所以在设计时是尽可能保证log日志小，它的数据结构如下其中topic是逻辑概念，分区对应就是一个物理文件夹：

所以在topic比较多时，分区文件数量会非常庞大磁盘顺序读效率还不如随机读效率，则会在topic比较多时磁盘顺序读就蜕变为随机读，延迟也就高了。

即 kafka 性能对于topic 有阈值(20 个)。

淘宝业务比较复杂，topic会比较多则为了解决这个痛点 rockertmq 就诞生了它的数据存储结构对此做了优化日志目录只有一个 commit log ，结构如下：

出发点不一样，kafka定位就是处理日志和大数据在这些业务领域，topic不会太多，延迟问题自然也就没有。

数据存储结构是主要原因，还有就是kafka只支持pull模式。而rocketmq有pull、push两种模式 (虽然这个push模式是假push)，push模式延迟肯定是比pull模式延迟低。

push模式是基于pull模式的，本地有个定时线程去pull broker的消息，缓存到本地，然后push到消费线程那边。

rabbit 的push模式是真的push 所以延迟最低的就是兔子。兔子不支持分布式，只支持主从模式本身设计就是小而美的单机版。cpu消耗比kafka之类低多了。