零拷贝(Zero-copy)是一种旨在减少数据在计算机里复制次数的方法,以提高数据传输的效率。
下面用从硬盘读取一个文件,通过网络发送出去的场景来介绍零拷贝。
1. 传统拷贝方式
1.1. 古老的纯CPU的IO
CPU拷贝4次、内核态和用户态切换4次。
1.2. 现在有DMA的普通IO
CPU拷贝2次、DMA拷贝2次,内核态和用户态切换4次。
2. 零拷贝
因为传统的方式都是4次拷贝(cpu4次,或cpu2次+dma2次)、内核用户态切换4次,比较耗时,零拷贝的思路就是减少这两个步骤里的次数。
下面为了画图简略,把发起读的时候硬盘写入到硬盘缓冲区这一步省略掉(就是上面图中0.1、0.2、0.3、0.4的4个步骤在图中省略掉)
2.1. mmap+write
mmap即内存映射,让应用程序里的用户缓冲区的一块内存与内核缓冲区中的一块内存映射起来,这样就只需要1次cpu拷贝、2次DMA拷贝、4次切换。
2.2. sendfile
sendfile是linux提供的一个系统调用函数,相当于替代前面的read+write两次系统调用函数的调用。所以这个方法就是1次cpu拷贝、2次DMA拷贝、2次切换。
2.3. sendfile+DMA收集
DMA收集需要硬件支持,数据直接从内核缓冲区拷贝到网卡,同时把传输的数据描述信息通过socket缓冲区返回给程序,这样0次cpu拷贝、2次DMA拷贝、2次切换。真正的零拷贝了。
2.4. splice
必须要通过管道的方式从内核缓冲区到Socket缓冲区传输,这样0次cpu拷贝、2次DMA拷贝、2次切换,也是零拷贝。