零拷贝技术

背景

磁盘可以说是计算机系统重最慢的硬件之一,读写速度相对内存10以上,所以针对优化磁盘的技术非常的多,比如:零拷贝、直接I/O、异步I/O等等,这些优化的目的就是为了提高系统的吞吐量,另外操作系统内核中的磁盘高速缓存区,也可以有效的减少磁盘的访问次数。

传统的数据传输方式

如果服务端提供数据传输功能,传统方式:将文件从磁盘上读取出来,然后通过网络协议写入,发送给客户端。

cpp 复制代码
read(file, tmp_buf, len);
write(socket, tmp_buf, len);

其中涉及到的内部流程如下:

  • 第一次拷贝(DMA拷贝):把数据从磁盘上拷贝到操作系统内核缓冲区。
  • 第二次拷贝(CPU拷贝):把内核缓冲区的数据拷贝到用户缓冲区,此时我们的程序就可以使用读到的数据
  • 第三次拷贝(CPU拷贝):把用户缓冲区的数据再拷贝到内核的socket缓冲区(套接字缓冲区)。
  • 第四次拷贝(DMA拷贝):把内核的socket缓冲区数据拷贝到网卡缓冲区中。

零拷贝方式

  • 第一次拷贝(DMA拷贝):通过DMA技术将磁盘数据拷贝到内核缓冲区中。
  • 第二次拷贝(DMA拷贝):内核缓冲区的"描述符"+"长度"传到socket缓冲区,然后SG-DMA控制器可直接将内核缓冲区中的数据拷贝到网卡中。此过程不需要将内核缓冲区中的数据拷贝到socket缓冲区中,这样减少了一次数据拷贝。

总结

零拷贝技术相对于传统文件传输,减少了2次上下文切换、2次CPU拷贝,最终只用2次上下文切换和2次DMA拷贝,不经过CPU拷贝

扩展

内核缓冲区实际上是磁盘高速缓存(PageCache),通常刚被访问的数据段时间内再次被访问的概率很高,于是我们可以用PageCache来缓存最近被访问的数据,,当空间不足时淘汰最久未被访问的缓存,所以读磁盘数据的时候,优先在PageCache中找,如果有就返回,没有则从磁盘读取,然后缓存在PageCache中。PageCache也具备预读功能。

例:假设read方法每次读取32kb字节,虽然read刚开始只读0~32kb的字节,但是内核会将后面的32~64KB也读取到PageCache,这样读取后面32~64kb的时候,如果在32~64kb数据被淘汰出PageCache前,进程读取到它了,此时速度就很快。

相关推荐
huisheng_qaq4 个月前
【kafka-04】kafka线上问题以及高效原理
分布式·kafka·消息队列·零拷贝·kafka线上问题·顺序io
流烟默5 个月前
Kafka【五】Buffer Cache (缓冲区缓存)、Page Cache (页缓存)和零拷贝技术
缓存·kafka·零拷贝
SRETalk5 个月前
SRE 必备知识 - Kafka 探秘之零拷贝技术
kafka·零拷贝
modelsetget6 个月前
面试官:说说Netty的零拷贝技术?
netty·io·零拷贝
WalkingWithTheWind~1 年前
Java BIO、NIO(通信/群聊系统、零拷贝)、AIO
java·网络编程·nio·零拷贝·群聊系统
@新法1 年前
Linux 零拷贝splice函数
linux·服务器·零拷贝·系统编程
Firechou1 年前
Kafka生产问题总结及性能优化实践
性能优化·kafka·零拷贝
Zero摄氏度1 年前
零拷贝详解
java·i/o·零拷贝
linux大本营1 年前
如何高效实现文件传输:小文件采用零拷贝、大文件采用异步io+直接io
linux·网络编程·零拷贝·异步io