滴滴二面:kafka的零拷贝原理?

在实际应用中,如果我们需要把磁盘中的某个文件内容发送到远程服务器上,如图

那么它必须要经过几个拷贝的过程,如图(贴图)。

1.从磁盘中读取目标文件内容拷贝到内核缓冲区

2.CPU控制器再把内核缓冲区的数据赋值到用户空间的缓冲区中

3.接着在应用程序中,调用write()方法,把用户空间缓冲区中的数据拷贝到内核下的SocketBuffer中。

4.最后,把在内核模式下的SocketBuffer中的数据赋值到网卡缓冲区(NICBuffer)5.网卡缓冲区再把数据传输到目标服务器上。

在这个过程中我们可以发现,数据从磁盘到最终发送出去,要经历4次拷贝,而在这四次拷贝过程中,有两次拷贝是浪费的,

分别是:6.从内核空间赋值到用户空间

7.从用户空间再次复制到内核空间

除此之外,由于用户空间和内核空间的切换会带来CPU的上线文切换,对于CPU性能也会造成性能影响。

而零拷贝,就是把这两次多于的拷贝省略掉,应用程序可以直接把磁盘中的数据从内核中直接传输给Socket,而不需要再经过应用程序所在的用户空间,

如下图所示。

零拷贝通过DMA(DirectMemoryAccess)技术把文件内容复制到内核空间中的ReadBuffer,接着把包含数据位置和长度信息的文件描述符加载到SocketBuffer中,DMA引擎直接可以把数据从内核空间中传递给网卡设备。

在这个流程中,数据只经历了两次拷贝就发送到了网卡中,并且减少了2次cpu的上下文切换,对于效率有非常大的提高。所以,所谓零拷贝,并不是完全没有数据赋值,只是相对于用户空间来说,不再需要进行数据拷贝。

对于前面说的整个流程来说,零拷贝只是减少了不必要的拷贝次数而已。在程序中如何实现零拷贝呢?

在Linux中,零拷贝技术依赖于底层的sendfile()方法实现

在Java中,FileChannal.transferTo()方法的底层实现就是sendfile()方法。

除此之外,还有一个map的文件映射机制它的原理是:将磁盘文件映射到内存,用户通过修改内存就能修改磁盘文件。使用这种方式可以获取很大的I/O提升,省去了用户空间到内核空间复制的开销。

相关推荐
robin591127 分钟前
rabbitmq-深入理解exchange/queue/routing-key等概念
分布式·rabbitmq
金海境科技42 分钟前
【服务器数据恢复】H3C华三Ceph分布式存储文件丢失数据恢复案例
服务器·经验分享·分布式·ceph
赫尔·普莱蒂科萨·帕塔42 分钟前
Kurator 分布式云原生环境技术深度分析与实践指南
分布式·云原生
永亮同学1 小时前
【探索实战】从“工具堆叠”到“平台治理”:基于 Kurator 构建统一分布式云原生管理底座的实践与思考
分布式·云原生
一起养小猫1 小时前
【探索实战】Kurator云边协同实践:基于KubeEdge的分布式物联网平台构建
分布式·物联网·struts
Wang's Blog1 小时前
RabbitMQ: 基于Docker技术实施集群部署实战指南
分布式·docker·rabbitmq
gordon~91 小时前
RabbitMQ -消息可靠 的实战示例
分布式·消息队列·rabbitmq·消息可靠性
Wang's Blog1 小时前
RabbitMQ:高效消息处理与资源管理实践
分布式·rabbitmq
Mr.朱鹏14 小时前
SQL深度分页问题案例实战
java·数据库·spring boot·sql·spring·spring cloud·kafka
脸大是真的好~15 小时前
分布式锁-基于redis实现分布式锁(不推荐)- 改进利用LUA脚本(不推荐)前面都是原理 - Redisson分布式锁
redis·分布式·lua