五种 IO 模型与阻塞 IO

我们在读数据的时候client向server要数据的时候是要等对方发过自己的接受缓冲区才有数据,IO了不一定有数据,也有可能在网络里跑要等,还有我们调用read等系统调用向内存要数据,其实是假借操作系统之手,创建子进程,继承文件描述符表,继承pcb其他数据,通过文件描述符找到数据在拷贝回来,这也要时间,所以IO的时候,我们可以认为 IO = 等 + 拷贝

五种 IO 模型

一个钓鱼例子说明五种IO模型

  1. 张三只有一根鱼竿钓鱼一直等鱼竿上钩在钓上来 ---阻塞IO
  2. 李四在钓鱼的同时也在看书,刷视频鱼咬钩了在钓 ---非阻塞IO
  3. 王五借助鱼竿上面的小铃铛,鱼咬钩了震动使铃铛响了反向告诉他鱼上钩了然后钓上来----信号驱动IO
  4. 赵六拉了100根鱼竿,挨个挨个检查看看有没有上钩 ---多路复用IO
  5. 田七想吃鱼但是没有自己去钓,而是找了个小王来帮他钓 --异步IO

上面五个人,只有田七效率高,其他人要么是一直钓要么是钓的过程中装模做样的好像效率高其实并没有,依旧在等,只有异步将IO交给了别人,自己去做其他的事了

区分同步异步:但凡是参与了等 或拷贝 都是同步,其余异步

1.阻塞 IO: 在内核将数据准备好之前, 系统调用会一直等待. 所有的套接字, 默认都是阻塞方式如scanf,cin,get,put等.

阻塞 IO 是最常见的 IO 模型.

2.非阻塞 IO: 如果内核还未将数据准备好, 系统调用仍然会直接返回, 并且返回EWOULDBLOCK 错误码.

非阻塞 IO 往往需要程序员循环的方式反复尝试读写文件描述符, 这个过程称为轮询. 这对 CPU 来说是较大的浪费, 一般只有特定场景下才使用.

3.信号驱动 IO: 内核将数据准备好的时候, 使用 SIGIO 信号通知应用程序进行 IO

操作.

4.IO 多路转接: 虽然从流程图上看起来和阻塞 IO 类似. 实际上最核心在于 IO 多路转接能够同时等待多个文件描述符的就绪状态.

5.异步 IO: 由内核在数据拷贝完成时, 通知应用程序(而信号驱动是告诉应用程序何时可以开始拷贝数据).

小结

任何 IO 过程中, 都包含两个步骤. 第一是等待, 第二是拷贝. 而且在实际的应用场景中, 等待消耗的时间往往都远远高于拷贝的时间. 让 IO 更高效, 最核心的办法就是让等待的时间尽量少.

IO的本质就是等+拷贝

同步通信 vs 异步通信(synchronous communication/asynchronous communication)

同步和异步关注的是消息通信机制.

同步 ,就是在发出一个调用时,在没有得到结果之前,该调用就不返回.但是一旦调用返回,就得到返回值了; 换句话说,就是由调用者主动等待这个调用的结果;
异步 则是相反,调用在发出之后,这个调用就直接返回了,所以没有返回结果; 换句话说,当一个异步过程调用发出后,调用者不会立刻得到结果; 而是在调用发出后,被调用者通过状态、通知来通知调用者,或通过回调函数处理这个调用.

另外, 我们回忆在讲多进程多线程的时候, 也提到同步和互斥. 这里的同步通信和进程之间的同步是完全不相干的概念.

进程/线程同步也是进程/线程之间直接的制约关系,是为完成某种任务而建立的两个或多个线程,这个线程需要在某些位置上协调,他们的工作次序而等待、传递信息所产生的制约关系. 尤其是在访问临界资源的时候.

以后在看到 "同步" 这个词, 一定要先搞清楚大背景是什么. 这个同步, 是同步通信异步通信的同步, 还是同步与互斥的同步.

阻塞 vs 非阻塞

阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.阻塞调用是指调用结果返回之前,当前线程会被挂起(如scanf,cin,get). 调用线程只有在得到结果之后才会返回.非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程.

其他高级 IO

非阻塞 IO,纪录锁,系统 V 流机制,I/O 多路转接(也叫 I/O 多路复用),readv 和writev 函数以及存储映射 IO(mmap),这些统称为高级 IO.我们此处重点讨论的是 I/O 多路转接

非阻塞 IO

在内核中,我们打开文件是以读方式,写方式,是否阻塞,内核中都记录下来了

fcntl

可以通过该系统调用将是否阻塞设置到系统调用里

一个文件描述符, 默认都是阻塞 IO.

函数原型如下:

cpp 复制代码
#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );

传入的 cmd 的值不同, 后面追加的参数也不相同.

fcntl 函数有 5 种功能:

  • 复制一个现有的描述符(cmd=F_DUPFD).
  • 获得/设置文件描述符标记(cmd=F_GETFD 或 F_SETFD).
  • 获得/设置文件状态标记(cmd=F_GETFL 或 F_SETFL).
  • 获得/设置异步 I/O 所有权(cmd=F_GETOWN 或 F_SETOWN).
  • 获得/设置记录锁(cmd=F_GETLK,F_SETLK 或 F_SETLKW).

我们此处只是用第三种功能, 获取/设置文件状态标记, 就可以将一个文件描述符设置为非阻塞.

实现函数 SetNoBlock

基于 fcntl, 我们实现一个 SetNoBlock 函数, 将文件描述符设置为非阻塞.

cpp 复制代码
void SetNoBlock(int fd) {
int fl = fcntl(fd, F_GETFL);
if (fl < 0) {
perror("fcntl");
return;
}
fcntl(fd, F_SETFL, fl | O_NONBLOCK);
}

使用 F_GETFL 将当前的文件描述符的属性取出来(这是一个位图).然后再使用 F_SETFL 将文件描述符设置回去. 设置回去的同时, 加上一个O_NONBLOCK 参数


阻塞

cpp 复制代码
#include<iostream>
#include<unistd.h>
int main()
{
    char buffer[1024];
    while(true)
    {
        //read 第一个参数为0,表示阻塞
        ssize_t n = read(0,buffer,sizeof(buffer));
        if(n > 0)
        {
            buffer[n]=0;
            std::cout<<buffer<<std::endl;
        }

    }
}

非阻塞

cpp 复制代码
#include <iostream>
#include <unistd.h>
#include <fcntl.h>
#include <cstdio>

void SetNonBlock(int fd)
{
    int fl = fcntl(fd, F_GETFL); // F_GETFL:获取该文件的标志位
    if (fl < 0)
    {
        perror("fcntl");
        return;
    }
    fcntl(fd,F_SETFL,fl | O_NONBLOCK);//O_NONBLOCK: 将fd设置为非阻塞
}
int main()
{
    SetNonBlock(0);//把标准输入改成非阻塞

    char buffer[1024];
    while (true)
    {
        ssize_t n = read(0, buffer, sizeof(buffer));
        if (n > 0)
        {
            buffer[n] = 0;
            std::cout << buffer << std::endl;
        }
        sleep(1);
        std::cout<<"."<<":"<<n<<std::endl;
    }
}

还可以ctrl + d,在Linux下表示输入结束,read的·返回值是0,类似读到文件结尾

修改代码,根据read的返回值优化,是读取错误还是底层数据没准备好

cpp 复制代码
#include <iostream>
#include <unistd.h>
#include <fcntl.h>
#include <cstdio>

void SetNonBlock(int fd)
{
    int fl = fcntl(fd, F_GETFL); // F_GETFL:获取该文件的标志位
    if (fl < 0)
    {
        perror("fcntl");
        return;
    }
    fcntl(fd,F_SETFL,fl | O_NONBLOCK);//O_NONBLOCK: 将fd设置为非阻塞
}
int main()
{
    SetNonBlock(0);//把标准输入改成非阻塞

    char buffer[1024];
    while (true)
    {
        ssize_t n = read(0, buffer, sizeof(buffer));
        if (n > 0)
        {
            buffer[n] = 0;
            std::cout << buffer << std::endl;
        }
        else if (n < 0)
        {
            //1.底层数据没有准备好
            if(errno == EAGAIN || errno ==EWOULDBLOCK)//错误码
            {
                std::cout<<"数据还没有准备好"<<std::endl;
                sleep(1);
                continue;
            }
            else if(errno == EINTR)
            {
                continue;
            }
            else
            {
                //2.读取出错
                
            }
            
        }
        else
        {
            break;
        }

        // sleep(1);
        // std::cout<<"."<<":"<<n<<std::endl;
    }
}