53 多路转接select

一. 初识select

初识select
系统提供select函数来实现多路复⽤输⼊/输出模型.
• select系统调⽤是⽤来让我们的程序监视多个⽂件描述符的状态变化的;
• 程序会停在select这⾥等待，直到被监视的⽂件描述符有⼀个或多个发⽣了状态改变;

我们知道IO=等+拷贝

其中对于等来说,select负责一件事情,就是一次可以等待多个fd,而一旦多个fd,有任意一个或多个fd的事件就绪了,select会通知上层,告诉调用方,哪些fd已经可以IO了

事件就绪是什么?

什么叫做可读? 底层有数据,可读就就绪

什么叫做可写? 底层有空间,可写就就绪

那么对于fd,一般默认来说,读未就绪,写则就绪

结论:select通过等待多个fd的一种就绪事件的通知机制

1.1select的函数原型如下

bash 复制代码

NAME
       select, pselect, FD_CLR, FD_ISSET, FD_SET, FD_ZERO - synchronous I/O multiplexing

SYNOPSIS
       #include <sys/select.h>

       int select(int nfds, fd_set *readfds, fd_set *writefds,
                  fd_set *exceptfds, struct timeval *timeout);

1.1.1 nfds

nfds即表示你要等待fd的最大值+1

1.1.2 timeout

注意,timeout既是一个输入参数,也是一个输出参数

输入参数,输入多久后到时因此设置为nullptr,就一直会进行等待,阻塞等待

如果全设置为0,就成为了非阻塞等待了

输出参数,输出还剩多少时间

1.1.3 select返回值

大于0 , 是几,就说明有几个fd就绪了

等于0 , 超时了,潜台词就是在就绪时间内,没有fd就绪,注,如果就绪时间为nullptr,就不会有等于0的情况

小于0 select出错

1.1.4 readfds

注意fd_set是一个位图 struct

既是输入型参数,也是输出型参数

输入

用户告诉内核,你要帮我关心哪些fd上的读事件

内核告诉用户,你让我关心的哪些fd上面的读事件已经就绪了

比特位的位置,表示文件描述符fd的编号

比特位的内容,表示是否就绪
那根据我们所说 fd_set是系统提供的一个数据类型,那就有固定类型

bash 复制代码

#include<iostream>
#include<sys/select.h>
int main()
{
    std::cout<<sizeof(fd_set)*8<<std::endl;
    return 0;
}

得出结果为1024 ,说明我们只能监听1024个,属实有点小了,那为什么还要用

1. 跨平台兼容性极强（核心优势）

select() + fd_set 是 POSIX 标准强制要求的接口 ，几乎所有类 Unix 系统（Linux、Unix、BSD、macOS）和 Windows 系统都原生支持。如果你的程序需要 "一次编写、多平台运行"（比如跨服务器系统、嵌入式设备），fd_set + select () 是最稳妥的选择 ------ 相比 Linux 特有的 epoll()、BSD 特有的 kqueue()，它不需要做平台适配判断。

2. 底层可控，资源开销极低

fd_set 本质是一个 "文件描述符位掩码"（比如 32 位整数可表示 0-31 号 fd，1 表示 "关注"，0 表示 "不关注"），其操作（FD_SET、FD_CLR、FD_ISSET）都是 位运算，执行效率极高。同时，fd_set 不需要内核维护复杂的数据结构（如 epoll 的红黑树），仅占用少量内存（默认 1024 位 = 128 字节），适合资源受限的场景（如嵌入式设备、低内存服务器）。

3. 接口简单，学习成本低

上述细节

1.位图是输入输出的,所以, 将来这个位图一定会被频繁变更

2.位图有多少个比特位,决定了select最多能关心多少个fd

3.readfds:如果把fd添加到readfds,代表只关心只读

那么如果想关心写呢? 将fd加入writefds

如果也想关心异常呢?也写入exceptfds

如果想先关心读,再关心写时?

先将读写入readfds,后续读取结束,再将fd写入writefds

1.5 select的特点

• 可监控的⽂件描述符个数取决于sizeof(fd_set)的值. 我这边服务器上sizeof(fd_set)＝512，每bit表
⽰⼀个⽂件描述符，则我服务器上⽀持的最⼤⽂件描述符是512*8=4096.
•将fd加⼊select监控集的同时，还要再使⽤⼀个数据结构array保存放到select监控集中的fd，
◦ ⼀是⽤于再select 返回后，array作为源数据和fd_set进⾏FD_ISSET判断。
◦ ⼆是select返回后会把以前加⼊的但并⽆事件发⽣的fd清空，则每次开始select前都要重新从
array取得fd逐⼀加⼊(FD_ZERO最先)，扫描array的同时取得fd最⼤值maxfd，⽤于select的第
⼀个参数。
缺点

每次调⽤select, 都需要⼿动设置fd集合, 从接⼝使⽤⻆度来说也⾮常不便.
• 每次调⽤select，都需要把fd集合从⽤⼾态拷⻉到内核态，这个开销在fd很多时会很⼤
• 同时每次调⽤select都需要在内核遍历传递进来的所有fd，这个开销在fd很多时也很⼤
• select⽀持的⽂件描述符数量太⼩
需要这里说到支持描述符数量太小,同时一个进程打开的文件描述符表是一个数组下标,但也应该有上限啊,但它是一个动态数组,可以变化

1.6 select的使用

要注意的是,读就绪要进行判断,是新连接到来还是普通socket可读

bash 复制代码

#pragma once

#include <iostream>
#include <memory>
#include <unistd.h>
#include "Socket.hpp"
#include "Log.hpp"

using namespace SocketModule;
using namespace LogModule;

class SelectServer
{
    const static int size = sizeof(fd_set) * 8;
    const static int defaultfd = -1;

public:
    SelectServer(int port) : _listensock(std::make_unique<TcpSocket>()), _isrunning(false)
    {
        _listensock->BuildTcpSocketMethod(port);
        for (int i = 0; i < size; i++)
            _fd_array[i] = defaultfd;

        _fd_array[0] = _listensock->Fd();
    }
    void Start()
    {
        _isrunning = true;
        while (_isrunning)
        {
            // 因为: listensockfd,也是一个fd，进程怎么知道listenfd上面有新连接到来了呢？
            // auto res = _listensock->Accept(); // 我们在select这里，可以进行accept吗？
            // 将listensockfd添加到select内部，让OS帮我关心listensockfd上面的读事件
            fd_set rfds;    // 定义fds集合
            FD_ZERO(&rfds); // 清空fds
            int maxfd = defaultfd;
            for (int i = 0; i < size; i++)
            {
                if (_fd_array[i] == defaultfd)
                    continue;
                // 1. 每次select之前，都要对rfds进行重置！
                FD_SET(_fd_array[i], &rfds);
                // 2. 最大fd，一定是变化的
                if (maxfd < _fd_array[i])
                {
                    maxfd = _fd_array[i]; // 更新出最大fd
                }
            }
            PrintFd();
            // struct timeval timeout = {0, 0};
            // select 返回之后，你怎么还知道哪些fd需要被添加到rfds，让select关心呢？
            // 所以：select要进行完整的设计，需要借助一个辅助数组！保存服务器历史获取过的所有的fd

            // rfds: 1111 1111
            // select负责事件就绪检测
            int n = select(maxfd + 1, &rfds, nullptr, nullptr, nullptr);
            // rfds: 0000 0000
            switch (n)
            {
            case -1:
                LOG(LogLevel::ERROR) << "select error";
                break;
            case 0:
                LOG(LogLevel::INFO) << "time out...";
                break;
            default:
                // 有事件就绪,就不仅仅是新连接到来了吧？读事件就绪啊？
                LOG(LogLevel::DEBUG) << "有事件就绪了..., n : " << n;
                Dispatcher(rfds); // 处理就绪的事件啊！
                break;
            }
        }

        _isrunning = false;
    }
    // 事件派发器
    void Dispatcher(fd_set &rfds /*, fd_set &wfds*/)
    {
        // 就不仅仅是新连接到来了吧？读事件就绪啊？ // 指定的文件描述符，在rfds里面，就证明该fd就绪了

        for (int i = 0; i < size; i++)
        {
            if (_fd_array[i] == defaultfd)
                continue;
            // fd合法，不一定就绪
            if (FD_ISSET(_fd_array[i], &rfds))
            {
                // fd_array[i] 上面一定是读就绪了
                // listensockfd 新连接到来，也是读事件就绪啊
                // sockfd 数据到来，读事件就绪啊
                if (_fd_array[i] == _listensock->Fd())
                {
                    // listensockfd 新连接到来
                    Accepter();
                }
                else
                {
                    // 普通的读事件就绪
                    Recver(_fd_array[i], i);
                }
            }

            // if (FD_ISSET(fd_array[i], &wfds))
            // {
            //     // fd_array[i] 上面一定是读就绪了
            // }
        }
    }

    // 链接管理器
    void Accepter()
    {
        InetAddr client;
        int sockfd = _listensock->Accept(&client); // accept会不会阻塞?
        if (sockfd >= 0)
        {
            // 获取新链接到来成功, 然后呢？？能不能直接
            // read/recv()， sockfd是否读就绪，我们不清楚
            // 只有谁最清楚，未来sockfd上是否有事件就绪？select！
            // 将新的sockfd，托管给select！
            // 如何托管? 将新的fd放入辅助数组！
            LOG(LogLevel::INFO) << "get a new link, sockfd: "
                                << sockfd << ", client is: " << client.StringAddr();
            int pos = 0;
            for (; pos < size; pos++)
            {
                if (_fd_array[pos] == defaultfd)
                    break;
            }
            if (pos == size)
            {
                LOG(LogLevel::WARNING) << "select server full";
                close(sockfd);
            }
            else
            {
                _fd_array[pos] = sockfd;
            }
        }
    }

    // IO处理器
    void Recver(int fd, int pos)
    {
        char buffer[1024];
        // 我在这里读取的时候，会不会阻塞?
        ssize_t n = recv(fd, buffer, sizeof(buffer)-1, 0); // recv写的时候有bug吗？
        if(n > 0)
        {
            buffer[n] = 0;
            std::cout << "client say@ "<< buffer << std::endl;
        }
        else if(n == 0)
        {
            LOG(LogLevel::INFO) << "clien quit...";
            // 1. 不要让select在关系这个fd了
            _fd_array[pos] = defaultfd;

            // 2. 关闭fd
            close(fd);
        }
        else 
        {
            LOG(LogLevel::ERROR) << "recv error";
            // 1. 不要让select在关系这个fd了
            _fd_array[pos] = defaultfd;

            // 2. 关闭fd
            close(fd);
        }
    }
    void PrintFd()
    {
        std::cout << "_fd_array[]: ";
        for (int i = 0; i < size; i++)
        {
            if (_fd_array[i] == defaultfd)
                continue;
            std::cout << _fd_array[i] << " ";
        }
        std::cout << "\r\n";
    }
    void Stop()
    {
        _isrunning = false;
    }
    ~SelectServer()
    {
    }

private:
    std::unique_ptr<Socket> _listensock;
    bool _isrunning;

    int _fd_array[size];
};