仿RabbitMQ实现消息队列———整体框架

在实际的后端开发中, 尤其是分布式系统⾥, 跨主机之间使⽤⽣产者消费者模型, 也是⾮常普遍的需求。因此, 我们通常会把阻塞队列封装成⼀个独⽴的服务器程序, 并且赋予其更丰富的功能。这样的服务程序我们就称为消息队列 (Message Queue, MQ)。
其中 RabbitMQ 是⼀个⾮常知名、功能强⼤且⼴泛使⽤的消息队列。本项目就是仿照RabbitMQ模拟实现一个简单的消息队列。

需求分析

• ⽣产者 (Producer)
• 消费者 (Consumer)
• 中间⼈ (Broker)
• 发布 (Publish)
• 订阅 (Subscribe)
我们需要实现的内容包括：

1.broker服务器：消息队列代理服务器
2.消息发布客户端：向服务器发布消息(生产者）
3.消息订阅客户端：从服务器订阅消息(消费者)
我们的消息队列是基于对AMQP协议的理解进行的整合，那么什么是AMQP协议呢：
AMQP (Advanced Message Queuing Protocol) 是一种网络协议，主要用于消息中间件之间的异步通信。AMQP 提供了一种标准的方式来发送和接收消息，使得不同厂商的消息中间件可以互相操作。

AMQP 特点：

开放标准：AMQP 是一个开放标准，这意味着它的规范是公开的，并且任何人都可以实现它。

二进制协议：AMQP 使用二进制编码，这使得它比基于文本的协议更高效。

可靠性：AMQP 设计为确保消息的可靠传输，包括确认机制、事务支持等。

灵活性：AMQP 支持多种消息路由模式，如点对点 (point-to-point) 和发布/订阅 (publish/subscribe)。

互操作性：AMQP 允许不同厂商的消息中间件互相通信，不受客户端或中间件使用的编程语言的影响。

AMQP 模型：

Broker (消息代理)：这是消息中间件的核心组件，负责接收、存储和转发消息。

Exchange (交换器)：Exchange 接收来自生产者的消息，并根据配置规则将消息发送到一个或多个队列。

Queue (队列)：队列是用来存储消息的数据结构，直到消费者取走这些消息。

Binding (绑定) ：绑定定义了 Exchange 和 Queue 之间的关系，确定消息如何从 Exchange 到达 Queue。所谓的 Exchange 和 Queue 可以理解成 "多对多" 关系, 和数据库中的 "多对多" ⼀样. 意思是: ⼀个 Exchange 可以绑定多个 Queue (可以向多个 Queue 中转发消息) ⼀个 Queue 也可以被多个 Exchange 绑定 (⼀个 Queue 中的消息可以来⾃于多个 Exchange)

Producer (生产者)：生产者是向消息中间件发送消息的应用程序。

Consumer (消费者)：消费者是从消息中间件接收消息的应用程序。
总结下来就是这样一张图

对于Broker来说，要实现一下核心API来实现消息队列的基本功能

1.创建交换机

2.销毁交换机

3.创建队列

4.销毁队列

5.创建绑定

6.解除绑定

7.发布消息

8.订阅消息

9.取消订阅

10.确认消息

生产者消费者则通过网络发送请求来调用这些API，实现生产者消费者模型

交换机类型

本项目实现三种交换机类型，也是最常见的：
• Direct: ⽣产者发送消息时, 直接指定被该交换机绑定的队列名
• Fanout: ⽣产者发送的消息会被复制到该交换机的所有队列中
• Topic: 绑定队列到交换机上时, 指定⼀个字符串为 bindingKey。发送消息指定⼀个字符串 routingKey。当 routingKey 和 bindingKey 满⾜⼀定的匹配条件的时候, 则把消息投递到指定队列

持久化

交换机，队列，绑定，消息都是需要持久化的，我们需要根据持久化来保证在程序或主机重启时数据不会丢失。在项目中我们使用了Sqlite数据库来进行本地的轻量级存储

网络通信

⽣产者和消费者都是客⼾端程序, Broker 则是作为服务器，通过⽹络进⾏通信。
我们在broker的基础上，再加上建立连接和打开信道的操作，这样可以更好地复用TCP连接，达到长连接的效果，避免频繁的创建关闭TCP连接。

二、服务端模块

1、交换机数据管理

交换机数据管理就是描述了交换机应该有哪些数据

我们可以设置交换机的类型以及消息的基本属性，基本结构如下：

cpp 复制代码

syntax ='proto3';
package bitmq;
enum ExchangeType
{
    UNKNOWTYPE=0;
    DIRECT=1;
    FANOUT=2;
    TOPIC=3;
};

enum DeliverMode
{
    UNKNOWMODE=0;
    UNDURABLE=1;
    DURABLE=2;
};

message BasicProperties
{
    string id=1;
    DeliverMode delivery_mode=2;
    string routing_key=3;
};
message message
{
    message Payload
    {
        BasicProperties properties=1;
        string body=2;
        string valid=3;
    };
    Payload payload=1;
    uint32 offset=2;
    uint32 length=3;
};

1、交换机的名称：也是交换机的唯一标识

2、交换机的类型：决定了消息的转发方式（三种）

每个队列与交换机绑定信息中有binding_key，每条消息中有routing_key

1.直接交换：binding_key与routing_key相同时，将消息放入队列

2.广播交换：交换机绑定的所有队列都放入消息

3.主题交换：根据具体的匹配算法，将符合匹配条件的binding_key和routing_key对应的队列放入消息。

3、持久化标志：决定当前交换机的数据是否需要持久化存储

4、自动删除标志：如果关联该交换机的客户端都退出了，是否需要自动删除交换机。

5、交换机的其他参数，在本项目中未具体使用。

对交换机的管理：

1、创建交换机：如果已存在就直接成功，不存在就创建（后续的一些结构也是如此操作）

cpp 复制代码

//声明交换机
        bool declareExchange(const std::string &name,ExchangeType type,bool durable,bool auto_delete,
        const google::protobuf::Map<std::string,std::string> &args)
        // bool declareExchange(const std::string &name,ExchangeType type,bool durable,bool auto_delete,
        // const std::unordered_map<std::string,std::string> &args)
        {
            std::unique_lock<std::mutex> lock(_mutex);
            auto it=_exchanges.find(name);
            if(it!=_exchanges.end())
            {
                //如果交换机已经存在，那么直接返回，不需要新增
                return true;
            }
            auto exp=std::make_shared<Exchange>(name,type,durable,auto_delete,args);
            if(durable==true)
            {
                //若为持久化，则添加到数据库中
                bool ret=_mapper.insert(exp);
                if(!ret) return ret;
            }
            //添加到交换机表中
            _exchanges.insert(std::make_pair(name,exp));
            return true;
        }

2、删除交换机：每个交换机都会绑定一个或多个队列，所以在删除前也要删除掉所有相关的绑定信息，若交换机为持久化，也要在数据库中删除，后续结构也是类似操作。

cpp 复制代码

//删除交换机
        void deleteExchange(const std::string &name)
        {
            std::unique_lock<std::mutex> lock(_mutex);
            auto it=_exchanges.find(name);
            if(it==_exchanges.end())
            {
                return;
            }
            if(it->second->durable==true) _mapper.remove(name);
            _exchanges.erase(name);
        }

3、获取指定名称交换机

4、获取当前所有交换机数量

2、队列数据管理

队列数据管理需要管理的数据

1、队列名称

2、持久化存储标志：决定是否将队列持久化存储起来，重启后队列是否依旧存在

3、是否独占标志：如果独占，那么只有当前客户端可以订阅该队列消息

4、自动删除标志：当订阅了当前队列的客户端退出后，是否删除队列。本项目中未实现

5、其他参数

队列管理类（与交换机管理类似）：

1、创建队列

2、删除队列

3、获取指定队列信息

4、获取队列数量

5、获取所有队列的名称：因为系统重启会重新加载数据，消息是以队列为单元存储在文件中的，所以加载消息需要知道队列的名称，因为在存储消息时，存储文件以队列名称进行取名

3、绑定数据管理

绑定数据管理：描述队列与交换机的绑定信息

管理的数据

1、交换机的名称

2、队列的名称

3、对应的binding_key：绑定密钥，在交换机主题交换和直接交换时要用到。

由数字，字符，_,#, . , * 组成，比如news.sport.# 就可以与news.sport.football匹配成功

管理的操作：

1、添加绑定信息

2、解除绑定信息

3、获取交换机所有的相关绑定信息：

1、在删除交换机的时候要删除相关的绑定信息

2、交换机也要通过这些信息来发布到指定的队列

4、获取队列所有的绑定信息：

1、删除队列的时候，也要删除相关的绑定信息

5、获取绑定信息的数量

4、消息数据管理

消息的基本属性

cpp 复制代码

message BasicProperties
{
    string id=1;
    DeliverMode delivery_mode=2;
    string routing_key=3;
};
message message
{
    message Payload
    {
        BasicProperties properties=1;
        string body=2;
        string valid=3;
    };
    Payload payload=1;
    uint32 offset=2;
    uint32 length=3;
};

消息属性：

1、消息ID：唯一标识

2、持久化标志（同队列与交换机）

3、 routing_key：决定了要发布的队列，交换机根据交换类型与binding来匹配

4、消息主体

以下是服务端在管理消息时添加的信息：

存储偏移量：消息以队列为单元存储在文件中，这个偏移量是相对于文件起始位置的偏移量

消息长度：从偏移量位置取出指定长度的消息。解决粘包问题

是否有效标志：标识当前消息是否被删除，因为如果删除消息就进行一次文件读写比较耗费资源，那么我们的策略是（删除一条消息不会将后面的数据拷贝到前边，而是重置了标志位valid,每次删除消息后判断：如果有效消息的数量占消息总数比例不到50%，且数据量超过2000，则进行垃圾回收，重新整理文件系统，当系统重启，也只需要加载有效消息。

消息的管理

以队列为单元进行管理，因为对于消息的所有操作是以队列为单元的

管理数据：

1、消息链表：保存所有待推送的消息

2、待确认hash:消息推送给客户后，会等待客户端确认，收到确认后，才会删除消息。

3、持久化hash：假设消息都需要持久化，操作过程中会垃圾回收，但是垃圾回收会改变存储位置，内存中消息的存储位置也需要改变，要用新位置去更新持久化数据

垃圾回收：将有效消息读出来，然后重新截断文件，将消息写入文件中

4、持久化的有效消息总量

5、持久化的总的消息数量：决定了什么时候进行消息回收

管理操作

1、向队列新增消息

2、获取队首消息：获取消息后，将消息从待推送链表中删除，加入到待确认消息中

3、对消息进行确认：从待确认消息中移除，并进行持久话数据的删除

4、恢复队列的历史消息：主要在构造函数中进行

5、垃圾回收（队列持久化子模块完成）：持久化文件中有效消息比例小于50%，总消息数超过2000进行垃圾回收

6、删除队列相关消息文件：当一个队列被删除了，他的消息也没有存在的意义了。

队列消息管理

1、初始化队列消息结构

2、移除队列消息结构：在队列被删除时调用

3、向队列中新增消息

4、对队列消息进行确认

5、恢复队列历史消息

5、虚拟机数据管理

虚拟机数据管理

对于交换机+队列+绑定信息+消息数据管理的整合

要管理的数据

1、交换机的管理句柄

2、队列数据的管理句柄

3、绑定信息的数据管理句柄

4、消息数据管理句柄

要管理的操作：

1、声明/删除交换机：在删除交换机的时候要删除相关的绑定信息

2、声明/删除队列：在删除队列的时候要删除相关的绑定信息以及数据

3、队列的绑定/解除绑定：绑定的时候，交换机和队列必须存在

4、获取指定队列的消息

5、对指定队列的指定消息进行确认

6、获取交换机相关的所有绑定信息：一条消息要发布给指定交换机的时候，交换机获取所有的绑定信息，来确认消息要发送到哪个队列

6、路由匹配管理

决定了一个消息能否发布到指定的队列中

在交换机与队列的绑定信息中有一个banding_key，这是队列发布的匹配规则

在每条要发布的消息中，都有一个routing_key，这是消息的发布规则

根据交换机的类型进行相关的匹配操作

路由匹配模块本质上来说没有管理的数据，只有向外提供的路由匹配操作：

1、判断routing_key是否符合规定：

格式判定：只能由数字，字母，_, . 构成

2、判断binding_key是否符合规定：

格式判断：只能由数字，字母，_ , # , * 构成

3、判断routing_key与binding_key能否匹配成功的接口

7、消费者管理

客户端有两种：发布消息，订阅消息

只有订阅了消息的客户端才是一个消费者

消费者数据存在的意义：当指定的客户端有了消息后，需要将消息推送给这个消费者客户端

推送的时候就要找到这个客户端的相关信息---------连接

消费者信息

1、消费者标识

2、订阅队列名称：当前队列有消息就会推送给这个客户端，当客户端收到消息，需要对指定队列的消息进行确认

3、自动确认标志：自动确认--推送消息后，直接删除消息不需要额外确认，手动确认------推送消息后需要等到确认回复再去删除消息

4、消费处理回调函数指针：队列有一条消息后，通过哪个函数进行处理（向指定客户端推送消息）

消费者管理

以队列为单元进行管理

每个消费者订阅的都是指定队列的消息，消费者对这个消息进行确认也是以队列进行确认

当队列中有消息了，必然是获取订阅了这个队列的消费者进行推送

队列消费者管理结构

数据信息：消费者链表------保存当前队列的所有消费者信息（RR轮转每次取出下一个消费者进行推送------一条消息只需要被一个客户端进行处理即可

管理操作：

1、新增消费者

2、RR轮转获取一个消费者

3、删除消费者

4、队列消费者数量

5、队列的消费者列表是否为空

消费者管理操作（以队列为单元进行管理）

1、初始化队列消费者结构

2、删除队列消费者结构

3、向指定队列中添加消费者

4、删除指定队列的指定消费者

5、获取指定队列的消费者

8、信道管理

信道是网络通信的一个概念，叫做通信信道

网络通信的时候，必然是通过网络连接来完成的，为了充分利用资源，细化出了信道的概念，对于用户来说，一个通信信道就是进行网络通信的载体，而一个真正的通信连接，可以创建出多个信道

每一个信道对于用户来说是独立的，但是本质的底层使用的是一个通信连接。

因此，信道是用户眼中的一个通道，所以所有的网络通信服务都由信道提供

1、声明/删除交换机

2、声明/删除队列

3、绑定信息的绑定/删除

4、消息的发布/订阅队列消息/取消订阅/队列消息的Ack

信道要管理的数据

1、信道ID

2、信道关联的消费者句柄：当信道关闭时，所有关联的消费者订阅都要取消，相当于删除所有的消费者。

3、信道关联的虚拟机句柄

4、工作线程池句柄：信道进行消息发布到指定队列后，要从指定队列的消费者链表中获取一个消费者，对这条消息进行消费，也就是将这条消息推送给客户端的操作要交给线程池来进行。并非每个信道都有一个线程池，而是整个服务器有一个线程池，大家所有的信道都是同一个线程池进行异步操作而已。

信道的管理

1、打开一个信道

2、关闭一个信道

3、获取指定信道句柄

9、连接管理

概念：网络通信连接

在网络通信模块，我们使用muduo库来实现底层通信，muduo库中本身就有Connection连接的概念和对象类。但是在我们的连接中还有一个上层的信道概念，这个概念在muduo库中是没有的。

因此我们需要在用户层面上对muduo库中的Connection连接进行二次封装，形成我们所需的连接管理

管理数据

1、muduo库的通信连接

2、当前连接关联的信道管理句柄

连接提供的操作

1、创建信道

2、关闭信道

连接管理的操作

1、新增连接

2、关闭连接

3、获取指定的连接信息

10、服务器模块

Broker服务器模块是一个功能的整合，本质上这个模块并不提供实质的功能性操作

这个模块最重要的是资源的整合，是一个资源的载体

1、一个服务器有一个工作线程池，其他所有的信道操作都是这一个线程池的。

2、一个服务器有一个虚拟机，其他所有的交换机，队列，绑定，消息的操作都是针对这个虚拟机进行的

3、一个服务器有一个消费者管理

4、通信相关的连接管理，协议处理模块句柄，也是一整个服务器有一套

三、客户端模块

1、消费者管理

消费者信息

1、消费者标识

2、订阅的队列名称

3、自动确认标志

4、消息的回调处理函数

当消费者订阅了一个队列的消息，这个队列有了消息后，就会将消息推送给这个客户端，这时候收到了消息就会通过回调函数处理，处理完毕后根据确认标志判断是否进行消息确认。

消费者管理：增删查操作

2、信道管理

所有提供的操作与服务端基本对应，因为客户端需要给用户提供什么服务，服务器就要给客户端提供什么服务。

管理信息

1、信道ID

2、消费者管理句柄：每个信道都有自己相关的消费者

3、线程池句柄：对推送的消息进行回调处理，处理过程通过工作线程来进行

4、信道关联的连接

信道提供的服务

1、声明/删除交换机

2、声明/删除队列

3、绑定信息的绑定/删除

4、消息的发布/订阅队列消息/取消订阅/队列消息的Ack

5、创建/关闭信道

信道的管理：信道的增删查操作

3、连接管理

客户端连接的管理，本质是对客户端TcpClient的二次封装和管理

对于用户，不需要有客户端的概念，连接对于用户来说就是客户端，通过连接创建信道来完成所需的服务，客户端这边的连接对用户来说就是一个资源的载体

管理操作：

1、连接服务器

2、创建信道

3、关闭信道

4、关闭连接

管理的资源：

异步线程池连接关联的信道管理句柄

4、异步线程池模块

TcpClient需要一个EventLoopThread模块进行IO事件监控

收到推送的消息，需要对推送过来的消息进行处理，因此需要一个线程池来帮助我们完成消息处理的过程。

将异步工作线程模块单独出来，是因为多个连接用一个EventLoopThread进行IO监控就够了，所有推送的消息处理也只需要有一个线程池就够了。

以上就是本项目的整体框架，完整代码已上传仓库，有兴趣的话可以查看：

https://gitee.com/Faiz--555/MQ