kafka 的零拷贝原理

文章目录

  • [kafka 的零拷贝原理](#kafka 的零拷贝原理)

今天来跟大家聊聊kafka的零拷贝原理是什么?

kafka 的零拷贝原理

零拷贝是一种减少数据拷贝的机制,能够有效提升数据的效率;

在实际应用中,如果我们需要把磁盘中的某个文件内容发送到远程服务器上, 那么它必须要经过几个拷贝的过程。

从磁盘中读取目标文件内容拷贝到内核缓冲区;

CPU 控制器再把内核缓冲区的数据赋值到用户空间的缓冲区中接着在应用程序中,调用 write() 方法,把用户空间缓冲区中的数据拷贝到内核下的 Socket Buffer 中。

最后,把在内核模式下的 SocketBuffer 中的数据赋值到网卡缓冲区(NIC Buffer)

网卡缓冲区再把数据传输到目标服务器上。

在这个过程中我们可以发现,数据从磁盘到最终发送出去,要经历 4 次拷贝,而在这四次拷贝过程中,有两次拷贝是浪费的,分别是:

从内核空间赋值到用户空间

从用户空间再次复制到内核空间,除此之外,由于用户空间和内核空间的切换会带来CPU 的上线文切换,对于CPU 性能也会造成性能影响。

而零拷贝,就是把这两次多于的拷贝省略掉,应用程序可以直接把磁盘中的数据从内核中直接传输给 Socket,而不需要再经过应用程序所在的用户空间,如下图所示。

零拷贝通过 DMA(Direct Memory Access)技术把文件内容复制到内核空间中的 Read Buffer,接着把包含数据位置和长度信息的文件描述符加载到 Socket Buffer 中,DMA 引擎直接可以把数据从内核空间中传递给网卡设备。

在这个流程中,数据只经历了两次拷贝就发送到了网卡中,并且减少了 2 次 cpu

的上下文切换,对于效率有非常大的提高。

所以,所谓零拷贝,并不是完全没有数据赋值,只是相对于用户空间来说,不再需要进行数据拷贝。对于前面说的整个流程来说,零拷贝只是减少了不必要的拷贝次数而已。

在程序中如何实现零拷贝呢?

在 Linux 中,零拷贝技术依赖于底层的 sendfile()方法实现;

在 Java 中,FileChannal.transferTo()方法的底层实现就是 sendfile()方法。

除此之外,还有一个 mmap 的文件映射机制,它的原理是:将磁盘文件映射到内存,用户通过修改内存就能修改磁盘文件。使用这种方式可以获取很大的 I/O 提升,省去了用户空间到内核空间复制的开销。

以上就是我个人对于 Kafka 中零拷贝原理的理解,感谢各位捧场!!!!

相关推荐
Surpass余sheng军1 天前
AI 时代下的网关技术选型
人工智能·经验分享·分布式·后端·学习·架构
哈哈哈笑什么1 天前
企业级高并发分布式SpringCloud系统下,订单动态超时自动取消(最终成熟方案),使用spring-cloud-starter-stream-rabbit
分布式·spring cloud·rabbitmq
哈哈哈笑什么1 天前
Sleuth+Zipkin 与 OpenSearch 结合是企业级分布式高并发系统的“王炸组合”
分布式·后端·spring cloud
RestCloud1 天前
如何用ETL做实时风控?从交易日志到告警系统的实现
数据库·数据仓库·kafka·数据安全·etl·数据处理·数据集成
哈哈哈笑什么1 天前
在高并发分布式SpringCloud系统中,什么时候时候并行查询,提高查询接口效率,从10s到100ms
java·分布式·后端
阿杰同学1 天前
Hadoop 面试题及答案整理,最新面试题
大数据·hadoop·分布式
听风吟丶1 天前
微服务分布式事务实战:从数据一致性到故障恢复全方案
分布式·微服务·架构
ClouGence1 天前
从 0 到 1 构建 TDSQL MySQL 实时同步链路
数据库·分布式·sql·mysql
技术破壁人1 天前
Kafka 的自动提交机制详解:Spring Boot 中如何正确使用?
kafka
哈哈哈笑什么1 天前
完整Redis分布式锁技术方案(基于Redisson)
redis·分布式·spring cloud