Kafka 零拷贝总结

今天看了些视频 感觉kafka 零拷贝和之前自己理解的有些出入

所以来总结一下

先说如果没有零拷贝 数据是怎么从磁盘发送到网卡的?

操作系统分内核态与用户态,从磁盘io读取数据这个操作要通过系统调用 从用户态切换到内核态进行,

所以

1.read()命令 发起系统调用 DMA把数据从磁盘拷贝到内核态的内核缓冲区 然后cpu把数据从内核态拷贝到用户态

2.write()命令 cpu把数据从用户态拷贝到内核态的socket缓冲区,然后用dma发送给网卡

这个过程中 一共发生两次系统调用 四次拷贝

kafka的零拷贝有mmap 和 sendfile两种方式

**mmap:**相当于把内核空间的缓冲区映射到用户空间 拷贝的只是这种映射关系,并不真的拷贝数据

使用mmap获取映射,再用send 发送数据(从内核缓冲区到socket缓冲区)

整个过程发送 两次系统调用和两次拷贝 只发生一次cpu拷贝

sendfile 真正的零拷贝,只有一次系统调用 共用一个内核缓冲区,减少了内核缓冲区到socket缓冲区的拷贝,整个过程只有一次系统调用和一次拷贝 且完全消除cpu拷贝(若是此时数据在pagecache里 甚至可以再减少一次磁盘DMA拷贝的过程)

是最快的方式

那为什么rabbitmq不也使用sendfile的拷贝方式 而是选择了mmap呢?

rabbitmq 有一些功能如死信队列的投递要用到时间发送的内容

而sendfile只会返回成功发送的字节数 所以rmq只能用mmap

相关推荐
小北方城市网1 天前
分布式锁实战指南:从选型到落地,避开 90% 的坑
java·数据库·redis·分布式·python·缓存
范桂飓1 天前
大模型分布式训练框架 Megatron-LM
人工智能·分布式
oMcLin1 天前
如何在Debian 11上通过配置MySQL 8.0的分布式架构,提升跨区域数据同步的效率与延迟?
分布式·mysql·debian
一条咸鱼_SaltyFish1 天前
[Day15] 若依框架二次开发改造记录:定制化之旅 contract-security-ruoyi
java·大数据·经验分享·分布式·微服务·架构·ai编程
IT 行者1 天前
Spring Security 7 OAuth2 授权码分布式存储之Redis存储方案
redis·分布式·spring
潇凝子潇1 天前
kafka之监控告警
分布式·kafka
Light601 天前
从“报告”到“能力”——构建智能化、可审计的数据治理闭环——领码 SPARK 数据质量平台白皮书
大数据·分布式·spark
maozexijr1 天前
RabbitMQ Exchange Headers类型存在的意义?
分布式·rabbitmq
还在忙碌的吴小二1 天前
XXL-SSO 分布式单点登录框架
分布式
独自破碎E1 天前
RabbitMQ的消息确认机制是怎么工作的?
分布式·rabbitmq