kafka零拷贝sendfile及mmap简述

概述

通常在选型比较消息中间件时,都会在备选栏有kafka;

kafka突出的特点就是高吞吐,零拷贝;

这里的零拷贝其实就是内核和用户空间之间没有copy,并不是真的0拷贝;

毕竟数据在磁盘,要读到网卡发送到网络上,至少得从磁盘copy到网卡吧;

说到零拷贝就要介绍下mmapsendfile了;kafka用的sendfilerocketmq用的mmap

rocketmq需要获取发送后的回执数据,所以用了mmap

bash 复制代码
# sendfile函数返回的是传输的字节数
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

# mmap成功返回指向目标内存区域的指针;失败,返回MAP_FAILED ((void*)-1),并设置errno
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);
  • mmap 适合小数据量读写,sendFile 适合大文件传输。
  • mmap 需要 4 次上下文切换,3 次数据拷贝;sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。
  • sendFile 可以利用 DMA 方式,减少 CPU 拷贝,mmap 则不能(必须从内核拷贝到 Socket 缓冲区)。

用户程序在操作系统中读取数据发送的过程

mmp映射优化后

mmap 通过内存映射,用户空间可以共享内核空间的数据。

这样,在进行网络传输时,减少了内核空间到用户空间的拷贝

sendfile优化后

linux2.1中内核buffer还会写到socket缓冲区,在linux2.4后直接就从内核copy到网络协议栈

相关推荐
代码改善世界4 小时前
【前瞻创想】Kurator:驾驭分布式云原生世界的“统一舰队”
分布式·云原生
行走正道4 小时前
【前瞻创想】标准之争:论Kurator在分布式云原生API标准化中的潜在角色
分布式·api·kurator·标准化·策略驱动
代码改善世界5 小时前
【探索实战】从零到一:Kurator 构建分布式云原生平台的探索与实践
分布式·云原生
9***Y485 小时前
后端在分布式中的Apache Kafka
分布式·kafka
yumgpkpm5 小时前
腾讯TBDS和Cloud Data AI CMP 比较的缺陷在哪里?
hive·hadoop·elasticsearch·zookeeper·spark·kafka·hbase
初学者,亦行者6 小时前
【前瞻创想】集成与创新并举,引领分布式云原生新范式
分布式·云原生
i***58676 小时前
【RabbitMQ】超详细Windows系统下RabbitMQ的安装配置
windows·分布式·rabbitmq
小马过河R6 小时前
tRPC-GO 框架Helloworld实践初体验
开发语言·分布式·后端·架构·golang·gin·beego
小小工匠6 小时前
大规模数据处理:12_Kappa架构剖析与Kafka在大规模流式数据处理中的应用实践
架构·kafka·kappa
小程故事多_806 小时前
Kthena 引爆云原生推理革命:K8s 分布式架构破解 LLM 编排困局,吞吐狂飙 273%
人工智能·分布式·云原生·kubernetes·aigc