kafka零拷贝sendfile及mmap简述

概述

通常在选型比较消息中间件时,都会在备选栏有kafka;

kafka突出的特点就是高吞吐,零拷贝;

这里的零拷贝其实就是内核和用户空间之间没有copy,并不是真的0拷贝;

毕竟数据在磁盘,要读到网卡发送到网络上,至少得从磁盘copy到网卡吧;

说到零拷贝就要介绍下mmapsendfile了;kafka用的sendfilerocketmq用的mmap

rocketmq需要获取发送后的回执数据,所以用了mmap

bash 复制代码
# sendfile函数返回的是传输的字节数
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

# mmap成功返回指向目标内存区域的指针;失败,返回MAP_FAILED ((void*)-1),并设置errno
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset);
  • mmap 适合小数据量读写,sendFile 适合大文件传输。
  • mmap 需要 4 次上下文切换,3 次数据拷贝;sendFile 需要 3 次上下文切换,最少 2 次数据拷贝。
  • sendFile 可以利用 DMA 方式,减少 CPU 拷贝,mmap 则不能(必须从内核拷贝到 Socket 缓冲区)。

用户程序在操作系统中读取数据发送的过程

mmp映射优化后

mmap 通过内存映射,用户空间可以共享内核空间的数据。

这样,在进行网络传输时,减少了内核空间到用户空间的拷贝

sendfile优化后

linux2.1中内核buffer还会写到socket缓冲区,在linux2.4后直接就从内核copy到网络协议栈

相关推荐
shuair3 小时前
redis分布式锁
数据库·redis·分布式
song5013 小时前
昇腾 910 的硬件架构:为什么它适合跑大模型
图像处理·人工智能·分布式·flutter·硬件架构·交互
会编程的土豆3 小时前
Kafka 操作流程(零基础完整流程)
分布式·kafka
未若君雅裁4 小时前
分布式接口幂等性设计:唯一索引、Token 与分布式锁
分布式·微服务
还在忙碌的吴小二4 小时前
TLog 分布式日志追踪新手入门指南
分布式
轻刀快马4 小时前
从底层 CPU 架构看透现代分布式与并发编程
分布式·架构·cpu
晚烛4 小时前
CANN 分布式通信与 HCCL:多 NPU 协作的底层机制
开发语言·人工智能·分布式·python·深度学习
岳麓丹枫0014 小时前
PostgreSQL 15.7 CDC → Flink → Kafka 操作笔记
postgresql·flink·kafka
青云计划4 小时前
分布式单飞锁
分布式
会编程的土豆4 小时前
Kafka 零基础入门(最基本用法)
分布式·kafka