网络IO基础知识

IO基本概念

IO全称为Input/Output,中文为输入/输出。在计算机中,常用的IO设备有硬盘、网络、键盘,显示器等。在操作系统层面,I/O系统有文件、网络、标准输入和输出,管道等。Java提供的IO类库就是用来读写这些IO系统的。

输入流:将文件、网络、标准输入(System.in)、管道中的数据,输入到内存中;

输出流:将内存中的数据输出到文件、网络、标准输出(System.out),管道中。

系统调用基本概念

当应用程序发起 I/O 调用后,会经历以下步骤:

java 复制代码
1. 应用发起read IO请求,然后阻塞  -> 第一阶段
2. 内核先检查buffer是否有相应的缓存数据  -> 第二阶段
  - 若没有,内核会去IO设备中读取(一般设备IO比较慢,需要等待),
  - 然后读取到kernel buffer中;
  - 若有,将数据从内核直接复制到进程空间中
注意:IO的效率主要取决于等待时间wait time 和 拷贝时间copy time

IO优化技术

mmap(memory-mapped file, 内存映射文件)

  • 适用场景:本地文件的读写,不适合网络【需要对数据大小有预估,网络数据无法预估】
    • 少量文件读写:使用基本的IO技术更合适,尽管需要数据拷贝,但是拷贝的数据量小,不太会影响读写性能
    • 大文件读写:数据拷贝非常影响性能,使用mmap更加合适
  • 基本原理:摒弃用户态和内核态的概念,使用物理内存、虚拟内存、缺页中断架构,相当于直接将数据在磁盘和用户空间之间互相拷贝,减少了数据拷贝次数。

在网络环境中,数据的大小往往是动态变化的,难以提前预估。而 mmap 在使用时通常需要对映射的文件大小等有一定的预估。因为 mmap

是将文件映射到内存空间,这个内存空间是需要预先分配或者至少有一个合理的预期范围的

sendfile零拷贝技术

  • 适用场景:用于两个IO设备之间互相传输数据,尤其是网络IO
  • 基本原理:减少不必要的拷贝次数和系统调用次数。
    • 直接从内核读缓冲区拷贝到内核写缓冲区,节省1次数据拷贝
    • 应用程序只需要一次sendfile系统调用,不需要read,write两次系统调用

阻塞/非阻塞/同步/异步基础概念

阻塞/非阻塞:强调的是主动轮询

  • 阻塞:去一家餐厅就餐,就餐的人太多,取号之后需要一直等待,啥也干不了
  • 非阻塞:取号之后,一会回来看一下有没有轮到你,没有就继续逛,可以干自己的事情

同步/异步:强调的是被通知

  • 异步:取号时登记了手机号,自己可以干自己的事情,服务员会打电话通知你
  • 同步:如果需要自己查看有没有轮到你,不管是阻塞还是非阻塞模式,都是同步
相关推荐
树℡独1 小时前
ns-3仿真之应用层(五)
服务器·网络·tcp/ip·ns3
zhang133830890752 小时前
CG-09H 超声波风速风向传感器 加热型 ABS材质 重量轻 没有机械部件
大数据·运维·网络·人工智能·自动化
酣大智3 小时前
接口模式参数
运维·网络·网络协议·tcp/ip
24zhgjx-lxq4 小时前
华为ensp:MSTP
网络·安全·华为·hcip·ensp
ling___xi4 小时前
《计算机网络》计网3小时期末速成课各版本教程都可用谢稀仁湖科大版都可用_哔哩哔哩_bilibili(笔记)
网络·笔记·计算机网络
REDcker4 小时前
Linux 文件描述符与 Socket 选项操作详解
linux·运维·网络
Up九五小庞5 小时前
用arpspoof实现100%批量切断192.168.110.10 - 192.168.110.100 断网(双向欺骗)--九五小庞
网络·开源
躺柒5 小时前
读数字时代的网络风险管理:策略、计划与执行04风险指引体系
大数据·网络·信息安全·数字化·网络管理·网络风险管理
独角鲸网络安全实验室5 小时前
本地信任成“致命漏洞”:数千Clawdbot Agent公网裸奔,供应链与内网安全告急
网络·网关·安全·php·漏洞·clawdbot·信任机制漏洞
ai_xiaogui5 小时前
Tailscale实现家庭与公司网络双向通信教程:子网路由配置详解
网络·tailscale·双向通信·子网路由配置详解·tailscale双向互访