Kafka 零拷贝总结

Pure03192025-09-12 18:25

今天看了些视频感觉kafka 零拷贝和之前自己理解的有些出入

所以来总结一下

先说如果没有零拷贝数据是怎么从磁盘发送到网卡的？

操作系统分内核态与用户态，从磁盘io读取数据这个操作要通过系统调用从用户态切换到内核态进行，

所以

1.read()命令发起系统调用 DMA把数据从磁盘拷贝到内核态的内核缓冲区然后cpu把数据从内核态拷贝到用户态

2.write()命令 cpu把数据从用户态拷贝到内核态的socket缓冲区，然后用dma发送给网卡

这个过程中一共发生两次系统调用四次拷贝

kafka的零拷贝有mmap 和 sendfile两种方式

**mmap:**相当于把内核空间的缓冲区映射到用户空间拷贝的只是这种映射关系，并不真的拷贝数据

使用mmap获取映射，再用send 发送数据(从内核缓冲区到socket缓冲区）

整个过程发送 两次系统调用和两次拷贝只发生一次cpu拷贝

sendfile 真正的零拷贝，只有一次系统调用共用一个内核缓冲区，减少了内核缓冲区到socket缓冲区的拷贝，整个过程只有一次系统调用和一次拷贝且完全消除cpu拷贝(若是此时数据在pagecache里甚至可以再减少一次磁盘DMA拷贝的过程)

是最快的方式

那为什么rabbitmq不也使用sendfile的拷贝方式而是选择了mmap呢？

rabbitmq 有一些功能如死信队列的投递要用到时间发送的内容

而sendfile只会返回成功发送的字节数所以rmq只能用mmap