Java面试34-Kafka的零拷贝原理

在实际应用中,如果我们需要把磁盘中的某个文件内容发送到远程服务器上,那么它必须要经过几个拷贝的过程:

  1. 从磁盘中读取目标文件内容拷贝到内核缓冲区
  2. CPU控制器再把内核缓冲区的数据复制到用户空间的缓冲区
  3. 在应用程序中,调用write()方法,把用户空间缓冲区中的数据拷贝到内核下的Socket Buffer中。
  4. 最后,把在内核模式下的Socket Buffer中的数据复制到网卡缓冲区(NIC Buffer),网卡缓冲区再把数据传输到目标服务器上。

在这个过程中可以发现,数据从磁盘到最终发送出去,要经历4次拷贝,而在这四次拷贝过程中,有两次拷贝是浪费的,分别是:从内核空间复制到用户空间从用户空间再次复制到内核空间。除此之外,由于用户空间和内核空间的切换会带来CPU的上下文切换,对于CPU性能也会造成性能影响。

零拷贝,就是把这两次多余的拷贝省略掉,应用程序可以直接把磁盘中的数据从内核中直接传输给Socket,而不需要再经过应用程序所在的用户空间 。零拷贝通过DMA(Direct Memory Access)技术把文件内容复制到内核空间中的Read Buffer,接着把包含数据位置和长度信息的文件描述符加载到Socket Buffer中,DMA引擎直接可以把数据从内核空间中传递给网卡设备。在这个流程中,数据只经历了两次拷贝就发送到了网卡中,并且减少了两次CPU的上下文切换,对于效率有非常大的提高。

所谓零拷贝,并不是完全没有数据复制,只是相对于用户空间来说,不再需要进行数据拷贝。对于前面说的整个流程来说,零拷贝只是减少了不必要的拷贝次数而已。在程序中实现零拷贝的方法有:

  • 在Linux中,零拷贝技术依赖于底层的sendfile()方法实现
  • 在Java中,FileChannel.transferTo()方法的底层实现就是sendfile()方法
  • mmap的文件映射机制,将磁盘文件映射到内存,用户通过修改内存就能修改磁盘文件,使用这种方式可以获取很大的I/O提升,省去了用户空间到内核空间复制的开销。
相关推荐
黑岚樱梦5 分钟前
Linux系统编程
java·开发语言·前端
我只会发热6 分钟前
超详细的 idea 类注释、方法注释、行注释配置(图文详解)
java·intellij-idea
姜西西_9 分钟前
自动化测试框架pytest之fixture
android·java·pytest
傻啦嘿哟13 分钟前
分布式爬虫架构:Scrapy+Kafka+Spark实战指南
分布式·爬虫·架构
鸽鸽程序猿15 分钟前
【项目】【抽奖系统】查询中奖记录
java·spring
计算机徐师兄16 分钟前
Java基于微信小程序的物流管理系统【附源码、文档说明】
java·微信小程序·物流管理系统·java物流管理系统小程序·物流管理系统小程序·物流管理系统微信小程序·java物流管理系统微信小程序
知其然亦知其所以然19 分钟前
JavaScript 变量的江湖恩怨:一篇文章彻底讲清楚
前端·javascript·面试
一点晖光20 分钟前
etcd 配置
分布式·etcd
青云交24 分钟前
Java 大视界 -- Java 大数据机器学习模型在金融风险管理体系构建与风险防范能力提升中的应用(435)
java·大数据·机器学习·spark·模型可解释性·金融风控·实时风控
跟‘码’死磕30 分钟前
springboot集成钉钉群内发送消息
java·spring boot·钉钉