目录
[3、RabbitMQ 上的⼀个 queue 中存放的 message 是否有数量限制?](#3、RabbitMQ 上的⼀个 queue 中存放的 message 是否有数量限制?)
1、上千万条消息在mq中积压了⼏个⼩时还没解决:
1 )先修复 consumer 的问题,确保其恢复消费速度,然后将现有 consumer 都停掉;
2 )新建⼀个 topic , partition 是原来的 10 倍,临时建⽴好原先 10 倍或者 20 倍的 queue 数量;
3 )然后写⼀个临时的分发数据的 consumer 程序,这个程序部署上去消费积压的数据;
消费之后不做耗时的处理,直接均匀轮询写⼊临时建⽴好的 10 倍数量的 queue ;
4 )接着临时征⽤ 10 倍的机器来部署 consumer ,每⼀批 consumer 消费⼀个临时 queue 的数据;
5 )这种做法相当于是临时将 queue 资源和 consumer 资源扩⼤ 10 倍,以正常的 10 倍速度来消费数据;
6 )等快速消费完积压数据之后,得恢复原先部署架构,重新⽤原先的 consumer 机器来消费消息。
总结:
- 修复并停掉 consumer ;
- 新建⼀个 topic , partition 是原来的 10 倍,建⽴临时 queue ,数量是原来的 10 倍或 20 倍;
- 写临时 consumer 程序,临时征⽤ 10 倍的机器去消费数据;
- 消费完成之后,恢复原先 consumer ;
2、rabbitmq设置过期时间,部分消息丢失:
采取批量重导⽅法:将丢失的那批数据查询导⼊到 mq ⾥⾯。
3、RabbitMQ 上的⼀个 queue 中存放的 message 是否有数量限制?
可以认为是⽆限制,因为限制取决于机器的内存,但是消息过多会导致处理效率的下降。
4、分布式部署:
RabbitMQ ⽆法容忍不同数据中⼼之间⽹络延迟,但是可以通过 3 种⽅式实现分布式部署: Federation 和 Shovel 。
5、如何确保消息正确地发送⾄RabbitMQ?
RabbitMQ使⽤发送⽅确认模式,确保消息正确地发送到RabbitMQ。
发送⽅确认模式:将信道设置成confirm模式(发送⽅确认模式),则所有在信道上发布的消息都会被指派⼀个唯⼀的
ID。⼀旦消息被投递到⽬的队列后,或者消息被写⼊磁盘后(可持久化的消息),信道会发送⼀个确认给⽣产者(包含消息唯
⼀ID)。如果RabbitMQ发⽣内部错误从⽽导致消息丢失,会发送⼀条nack(not acknowledged,未确认)消息。
发送⽅确认模式是异步的,⽣产者应⽤程序在等待确认的同时,可以继续发送消息。当确认消息到达⽣产者应⽤程序,⽣
产者应⽤程序的回调⽅法就会被触发来处理确认消息。
6、如何确保消息接收⽅消费了消息?
接收⽅消息确认机制:消费者接收每⼀条消息后都必须进⾏确认(消息接收和消息确认是两个不同操作)。只有消费者确
认了消息,RabbitMQ才能安全地把消息从队列中删除。
这⾥并没有⽤到超时机制,RabbitMQ仅通过Consumer的连接中断来确认是否需要重新发送消息。也就是说,只要连接不
中断,RabbitMQ给了Consumer⾜够⻓的时间来处理消息。
特殊情况:
1、如果消费者接收到消息,在确认之前断开了连接或取消订阅,RabbitMQ会认为消息没有被分发,然后重新分发给下⼀
个订阅的消费者。(可能存在消息重复消费的隐患,需要根据bizId去重)
2、如果消费者接收到消息却没有确认消息,连接也未断开,则RabbitMQ认为该消费者繁忙,将不会给该消费者分发更多
的消息。
7、如何避免消息重复投递或重复消费?
在消息⽣产时, MQ 内部针对每条⽣产者发送的消息⽣成⼀个 inner-msg-id ,作为去重和幂等的依据(消息投递失败并重
传),避免重复的消息进⼊队列;在消息消费时,要求消息体中必须要有⼀个 bizId (对于同⼀业务全局唯⼀,如⽀付 ID 、订单
ID 、帖⼦ ID 等)作为去重和幂等的依据,避免同⼀条消息被重复消费。
8、消息基于什么传输?
由于TCP连接的创建和销毁开销较⼤,且并发数受系统资源限制,会造成性能瓶颈。RabbitMQ使⽤信道的⽅式来传输数据。信道是建⽴在真实的TCP连接内的虚拟连接,且每条TCP连接上的信道数量没有限制。
1、RabbitMQ采⽤类似NIO(Non-blocking I/O)做法,选择TCP连接复⽤,不仅可以减少性能开销,同时也便于管理。
2、每个线程把持⼀个信道,所以信道服⽤了Connection的TCP连接。同时RabbitMQ可以确保每个线程的私密性,就像拥有
独⽴的连接⼀样。
9、消息如何分发?
若该队列⾄少有⼀个消费者订阅,消息将以循环( round-robin )的⽅式发送给消费者。每条消息只会分发给⼀个订阅的
消费者(前提是消费者能够正常处理消息并进⾏确认)。
10、消息怎么路由?
从概念上来说,消息路由必须有三部分:交换器、路由、绑定。⽣产者把消息发布到交换器上;绑定决定了消息如何从交
换器路由到特定的队列;消息最终到达队列,并被消费者接收。
1 、消息发布到交换器时,消息将拥有⼀个路由键( routing key ),在消息创建时设定。
2 、通过队列路由键,可以把队列绑定到交换器上。
3 、消息到达交换器后, RabbitMQ 会将消息的路由键与队列的路由键进⾏匹配(针对不同的交换器有不同的路由规则)。
4 、如果能够匹配到队列,则消息会投递到相应队列中;如果不能匹配到任何队列,消息将进⼊ "⿊洞"。
11、如何确保消息不丢失?
消息持久化的前提是:将交换器/队列的durable属性设置为true,表示交换器/队列是持久交换器/队列,在服务器崩溃或重
启之后不需要重新创建交换器/队列(交换器/队列会⾃动创建)。
如果消息想要从Rabbit崩溃中恢复,那么消息必须:
1、在消息发布前,通过把它的 "投递模式" 选项设置为2(持久)来把消息标记成持久化
2、将消息发送到持久交换器
3、消息到达持久队列
RabbitMQ确保持久性消息能从服务器重启中恢复的⽅式是,将它们写⼊磁盘上的⼀个持久化⽇志⽂件,当发布⼀条
持久性消息到持久交换器上时,Rabbit会在消息提交到⽇志⽂件后才发送响应(如果消息路由到了⾮持久队列,它会⾃动
从持久化⽇志中移除)。⼀旦消费者从持久队列中消费了⼀条持久化消息,RabbitMQ会在持久化⽇志中把这条消息标记为
等待垃圾收集。如果持久化消息在被消费之前RabbitMQ重启,那么Rabbit会⾃动重建交换器和队列(以及绑定),并重播
持久化⽇志⽂件中的消息到合适的队列或者交换器上。
12、使⽤RabbitMQ有什么好处?
- 应⽤解耦(系统拆分)
- 异步处理(预约挂号业务处理成功后,异步发送短信、推送消息、⽇志记录等,可以⼤⼤减⼩响应时间)
- 消息分发
- 流量削峰:将请求发送到队列中,短暂的⾼峰期积压是允许的。
- 消息缓冲
...
13、消息队列有什么缺点?
- 系统可⽤性降低:消息队列出问题影响业务;
- 系统复杂性增加:加⼊消息队列,需要考虑很多⽅⾯的问题,⽐如:⼀致性问题、如何保证消息不被重复消费、如何保
证消息可靠性传输等。
14、MQ如何选型?
|-------|-----------------------------------|-----------------------------------------|-----------------|------------------------------------------------------|
| 特 性 | ActiveMQ | RabbitMQ | RocketMQ | kafka |
| 开发语⾔ | java | erlang | java | scala |
| 单机吞吐量 | 万级 | 万级 | 10 万级 | 10 万级 |
| 时效性 | ms 级 | us 级 | ms 级 | ms 级以内 |
| 可⽤性 | ⾼(主从架构) | ⾼(主从架构) | ⾮常⾼(分布式架构) | ⾮常⾼(分布式架构) |
| 功能特性 | 成熟的产品,在很多公司 得到应⽤;有较多的⽂ 档;各种协议⽀持较好 | 基于erlang开发,所以并发能⼒很强,性能极其 好,延时很低;管理界⾯较丰富 | MQ 功能⽐较完备,扩展 性佳 | 只⽀持主要的MQ功能,像⼀些消息查询,消息回 溯等功能没有供,毕竟是为⼤数据准备的,在⼤数据领域应⽤⼴。 |
- 中⼩型公司⾸选 RabbitMQ :管理界⾯简单,⾼并发。
- ⼤型公司可以选择 RocketMQ :更⾼并发,可对 rocketmq 进⾏定制化开发。
- ⽇志采集功能,⾸选 kafka ,专为⼤数据准备。
15、如何保证消息队列⾼可⽤?
- 集群:
集群可以扩展消息通信的吞吐量,但是不会备份消息,备份消息要通过镜像队列的⽅式解决 。
队列存储在单个节点 、交换器存储在所有节点 。
- 镜像队列:将需要消费的队列变为镜像队列,存在于多个节点,这样就可以实现 RabbitMQ 的 HA ⾼可⽤性。 作⽤就是消
息实体会主动在镜像节点之间实现同步 ,⽽不是像普通模式那样,在 consumer 消费数据时临时读取。 缺点就是,集群内部的
同步通讯会占⽤⼤量的⽹络带宽。
16、如何保证消息的顺序性?
- 通过某种算法,将需要保持先后顺序的消息放到同⼀个消息队列中( kafka 中就是 partition , rabbitMq 中就是
queue )。然后只⽤⼀个消费者去消费该队列。
- 可以在 消息体内添加全局有序标识来实现 。
17 、使⽤ RabbitMQ 增加 rest 服务吞吐量。
18、RabbitMQ交换器有哪些类型?
- fanout交换器:它会把所有发送到该交换器的消息路由到所有与该交换器绑定的队列中;
- direct交换器:direct类型的交换器路由规则很简单,它会把消息路由到哪些BindingKey和RoutingKey完全匹配的队列
中;- topic交换器:匹配规则⽐direct更灵活。
- headers交换器:根据发送消息内容的headers属性进⾏匹配(由于性能很差,不实⽤)。
常⽤的交换器主要分为以下三种:
1、direct:如果路由键完全匹配,消息就被投递到相应的队列
2、fanout:如果交换器收到消息,将会⼴播到所有绑定的队列上
3、topic:可以使来⾃不同源头的消息能够到达同⼀个队列。 使⽤topic交换器时,可以使⽤通配符,⽐如:"*" 匹配特定位
置的任意⽂本, "." 把路由键分为了⼏部分,"#" 匹配所有规则等。特别注意:发往topic交换器的消息不能随意的设置选择
键(routing_key),必须是由"."隔开的⼀系列的标识符组成。
19、RabbitMQ如何保证数据⼀致性?
- ⽣产者确认机制:消息持久化后异步回调通知⽣产者,保证消息已经发出去;
- 消息持久化:设置消息持久化;
- 消费者确认机制:消费者成功消费消息之后,⼿动确认,保证消息已经消费。
20、RabbitMQ消费者⾃动扩展数量
SimpleMessageListenerContainer 可根据 RabbitMQ 消息堆积情况⾃动扩展消费者数量。
21、RabbitMQ结构:
a. Broker :简单来说就是消息队列服务器实体。
b. Exchange :消息交换机,它指定消息按什么规则,路由到哪个队列。
c. Queue :消息队列载体,每个消息都会被投⼊到⼀个或多个队列。
d. Binding :绑定,它的作⽤就是把 exchange 和 queue 按照路由规则绑定起来。
e. Routing Key :路由关键字, exchange 根据这个关键字进⾏消息投递。
f. vhost :虚拟主机,⼀个 broker ⾥可以开设多个 vhost ,⽤作不同⽤户的权限分离。
g. producer :消息⽣产者,就是投递消息的程序。
h. consumer :消息消费者,就是接受消息的程序。
i. channel :消息通道,在客户端的每个连接⾥,可建⽴多个 channel ,每个 channel 代表⼀个会话任务。
22、rabbitmq队列与消费者的关系?
- ⼀个队列可以绑定多个消费者;
- 消息默认以循环的⽅式发送给消费者;
- 消费者收到消息默认⾃动确认,也可以改成⼿动确认。