【RDMA学习笔记】1：RDMA（Remote Direct Memory Access）介绍

什么是RDMA

Remote Direct Memory Access，也就是Remote的DMA，是一种硬件机制，能直接访问远端结点的内存，而不需要处理器介入。

其中：

也就说明了适用场景

可以看到RDMA绕过kenel mode的同时也bypass了这些协议栈

buffer在使用前需要在网卡那边注册一下，具体地，在注册阶段需要：

RDMA通信是基于Send、Receive、Completion这三种队列的，其中Send和Receive的queue属于work queue，总是以Queue Pair的形式被创建。SQ和RQ用于schedule work，当work完成时，CQ用于通知。

在工作时，应用会issue一个work request，这个struct包含了指向一个buffer的指针：

而一旦一个work request完成了，那么adapter就会往CQ里塞一个元素。

IB (InfiniBand)、RoCE (RDMA over Converged Ethernet)、iWARP (internet Wide Area RDMA Protocol)

并没有指定data transfer的语义，RDMA网络支持两种访问模型：

这是最传统的消息传递模式，消息源和目标方都积极地参与通信。

双方都需要创建：

发送方的work request会指向要传输的buffer，然后把这个WQE塞到SQ里发过去。

接收方的work request会指向一个empty buffer用于接收数据，通过这种方式WQE会被添加到对应的RQ里。

在send+receive完成之后，也就是直接写入了remote的registered memory，然后双方的CQ里都会被添加一个CQE表示完成了。

只有发起方是活动的，接收方是纯被动的，不会issue任何操作，也不会有CPU cycle，甚至完全不会感知到有read/write发生了。

如果要发起RDMA read/write，那么work request必须包含：

也就是说要使用RDMA read/write，发起方必须事先就知道这两个knowledge。

RDMA有很多好处，但也因为开发者需要使用它的Verbs API带来了额外的复杂性。