大数据课程I4——Kafka的零拷贝技术

伟雄2023-08-14 12:54

文章作者邮箱：yugongshiye@sina.cn 地址：广东惠州

▲ 本章节目的

⚪ 掌握Kafka的零拷贝技术；

⚪ 了解常规的文件传输过程；

一、常规的网络传输原理

表面上一个很简单的网络文件输出的过程，在OS底层，会发现数据会被拷贝4次。

内核态可以理解为特权态，可以访问计算机的所有资源。

而用户态的访问资源是受限的。

上图中，如果要对文件数据修改，则只能在用户态的缓冲区修改，所以需要拷贝4次。

但如果仅仅是发送文件数据，则 copy 4 次是没有意义的，并且还是产生 4 次内核态和用户态的切换，这些都需要小号CPU性能的。

二、Kafka的零拷贝技术

总结：

Kafka的写入性能高：因为底层是磁盘顺序写。
Kafka的读取性能高，因为底层是由索引机制。
Kafka的传输性能高，因为底层使用Zero Copy技术。

上一篇：Spring kafka源码分析——消息是如何消费的

下一篇：kafka是有序的吗？如何保证有序？

热门推荐

01GitHub 镜像站点 02Labelme从安装到标注：零基础完整指南 03安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口（持续更新）04Linux下V2Ray安装配置指南 05Claude Code 2.1.2 升级报错？别折腾了，一行命令搞定 062025-04-03 Latex学习1——本地配置Latex + VScode环境 07jdk21下载、安装（Windows、Linux、macOS）08【踩坑笔记】50系显卡适配的 PyTorch 安装 09Overleaf编译超时，超出免费计划编译时限（已解决）10UV安装并设置国内源