一. 初识select
初识select
系统提供select函数来实现多路复⽤输⼊/输出模型.
• select系统调⽤是⽤来让我们的程序监视多个⽂件描述符的状态变化的;
• 程序会停在select这⾥等待,直到被监视的⽂件描述符有⼀个或多个发⽣了状态改变;
我们 知道IO=等+拷贝
其中对于等来说,select负责一件事情,就是一次可以等待多个fd,而一旦多个fd,有任意一个或多个fd的事件就绪了,select会通知上层,告诉调用方,哪些fd已经可以IO了
事件就绪是什么?
什么叫做可读? 底层有数据,可读就就绪
什么叫做可写? 底层有空间,可写就就绪
那么对于fd,一般默认来说,读未就绪,写则就绪
结论:select通过等待多个fd的一种就绪事件的通知机制
1.1select的函数原型如下
bash
NAME
select, pselect, FD_CLR, FD_ISSET, FD_SET, FD_ZERO - synchronous I/O multiplexing
SYNOPSIS
#include <sys/select.h>
int select(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, struct timeval *timeout);
1.1.1 nfds
nfds即表示你要等待fd的最大值+1
1.1.2 timeout
注意,timeout既是一个输入参数,也是一个输出参数
输入参数,输入多久后到时 因此设置为nullptr,就一直会进行等待,阻塞等待
如果全设置为0,就成为了非阻塞等待了
输出参数,输出还剩多少时间

1.1.3 select返回值
大于0 , 是几,就说明有几个fd就绪了
等于0 , 超时了,潜台词就是在就绪时间内,没有fd就绪,注,如果就绪时间为nullptr,就不会有等于0的情况
小于0 select出错
1.1.4 readfds
注意fd_set是一个位图 struct
既是输入型参数,也是输出型参数
输入
用户告诉内核,你要帮我关心哪些fd上的读事件
返回
内核告诉用户,你让我关心的哪些fd上面的读事件已经就绪了
比特位的位置,表示文件描述符fd的编号
比特位的内容,表示是否就绪
那根据我们所说 fd_set是系统提供的一个数据类型,那就有固定类型
bash
#include<iostream>
#include<sys/select.h>
int main()
{
std::cout<<sizeof(fd_set)*8<<std::endl;
return 0;
}
得出结果为1024 ,说明我们只能监听1024个,属实有点小了,那为什么还要用
1. 跨平台兼容性极强(核心优势)
select()+ fd_set 是 POSIX 标准强制要求的接口 ,几乎所有类 Unix 系统(Linux、Unix、BSD、macOS)和 Windows 系统都原生支持。如果你的程序需要 "一次编写、多平台运行"(比如跨服务器系统、嵌入式设备),fd_set + select () 是最稳妥的选择 ------ 相比 Linux 特有的epoll()、BSD 特有的kqueue(),它不需要做平台适配判断。2. 底层可控,资源开销极低
fd_set 本质是一个 "文件描述符位掩码"(比如 32 位整数可表示 0-31 号 fd,1 表示 "关注",0 表示 "不关注"),其操作(
FD_SET、FD_CLR、FD_ISSET)都是 位运算,执行效率极高。同时,fd_set 不需要内核维护复杂的数据结构(如 epoll 的红黑树),仅占用少量内存(默认 1024 位 = 128 字节),适合资源受限的场景(如嵌入式设备、低内存服务器)。3. 接口简单,学习成本低
上述细节
1.位图是输入输出的,所以, 将来这个位图一定会被频繁变更
2.位图有多少个比特位,决定了select最多能关心多少个fd
3.readfds:如果把fd添加到readfds,代表只关心只读
那么如果想关心写呢? 将fd加入writefds
如果也想关心异常呢?也写入exceptfds
如果想先关心读,再关心写时?
先将读写入readfds,后续读取结束,再将fd写入writefds
1.5 select的特点
• 可监控的⽂件描述符个数取决于sizeof(fd_set)的值. 我这边服务器上sizeof(fd_set)=512,每bit表
⽰⼀个⽂件描述符,则我服务器上⽀持的最⼤⽂件描述符是512*8=4096.
•将fd加⼊select监控集的同时,还要再使⽤⼀个数据结构array保存放到select监控集中的fd,
◦ ⼀是⽤于再select 返回后,array作为源数据和fd_set进⾏FD_ISSET判断。
◦ ⼆是select返回后会把以前加⼊的但并⽆事件发⽣的fd清空,则每次开始select前都要重新从
array取得fd逐⼀加⼊(FD_ZERO最先),扫描array的同时取得fd最⼤值maxfd,⽤于select的第
⼀个参数。
缺点
每次调⽤select, 都需要⼿动设置fd集合, 从接⼝使⽤⻆度来说也⾮常不便.
• 每次调⽤select,都需要把fd集合从⽤⼾态拷⻉到内核态,这个开销在fd很多时会很⼤
• 同时每次调⽤select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很⼤
• select⽀持的⽂件描述符数量太⼩
需要这里说到支持描述符数量太小,同时一个进程打开的文件描述符表是一个数组下标,但也应该有上限啊,但它是一个动态数组,可以变化
1.6 select的使用
要注意的是,读就绪要进行判断,是新连接到来还是普通socket可读
bash
#pragma once
#include <iostream>
#include <memory>
#include <unistd.h>
#include "Socket.hpp"
#include "Log.hpp"
using namespace SocketModule;
using namespace LogModule;
class SelectServer
{
const static int size = sizeof(fd_set) * 8;
const static int defaultfd = -1;
public:
SelectServer(int port) : _listensock(std::make_unique<TcpSocket>()), _isrunning(false)
{
_listensock->BuildTcpSocketMethod(port);
for (int i = 0; i < size; i++)
_fd_array[i] = defaultfd;
_fd_array[0] = _listensock->Fd();
}
void Start()
{
_isrunning = true;
while (_isrunning)
{
// 因为: listensockfd,也是一个fd,进程怎么知道listenfd上面有新连接到来了呢?
// auto res = _listensock->Accept(); // 我们在select这里,可以进行accept吗?
// 将listensockfd添加到select内部,让OS帮我关心listensockfd上面的读事件
fd_set rfds; // 定义fds集合
FD_ZERO(&rfds); // 清空fds
int maxfd = defaultfd;
for (int i = 0; i < size; i++)
{
if (_fd_array[i] == defaultfd)
continue;
// 1. 每次select之前,都要对rfds进行重置!
FD_SET(_fd_array[i], &rfds);
// 2. 最大fd,一定是变化的
if (maxfd < _fd_array[i])
{
maxfd = _fd_array[i]; // 更新出最大fd
}
}
PrintFd();
// struct timeval timeout = {0, 0};
// select 返回之后,你怎么还知道哪些fd需要被添加到rfds,让select关心呢?
// 所以:select要进行完整的设计,需要借助一个辅助数组!保存服务器历史获取过的所有的fd
// rfds: 1111 1111
// select负责事件就绪检测
int n = select(maxfd + 1, &rfds, nullptr, nullptr, nullptr);
// rfds: 0000 0000
switch (n)
{
case -1:
LOG(LogLevel::ERROR) << "select error";
break;
case 0:
LOG(LogLevel::INFO) << "time out...";
break;
default:
// 有事件就绪,就不仅仅是新连接到来了吧?读事件就绪啊?
LOG(LogLevel::DEBUG) << "有事件就绪了..., n : " << n;
Dispatcher(rfds); // 处理就绪的事件啊!
break;
}
}
_isrunning = false;
}
// 事件派发器
void Dispatcher(fd_set &rfds /*, fd_set &wfds*/)
{
// 就不仅仅是新连接到来了吧?读事件就绪啊? // 指定的文件描述符,在rfds里面,就证明该fd就绪了
for (int i = 0; i < size; i++)
{
if (_fd_array[i] == defaultfd)
continue;
// fd合法,不一定就绪
if (FD_ISSET(_fd_array[i], &rfds))
{
// fd_array[i] 上面一定是读就绪了
// listensockfd 新连接到来,也是读事件就绪啊
// sockfd 数据到来,读事件就绪啊
if (_fd_array[i] == _listensock->Fd())
{
// listensockfd 新连接到来
Accepter();
}
else
{
// 普通的读事件就绪
Recver(_fd_array[i], i);
}
}
// if (FD_ISSET(fd_array[i], &wfds))
// {
// // fd_array[i] 上面一定是读就绪了
// }
}
}
// 链接管理器
void Accepter()
{
InetAddr client;
int sockfd = _listensock->Accept(&client); // accept会不会阻塞?
if (sockfd >= 0)
{
// 获取新链接到来成功, 然后呢??能不能直接
// read/recv(), sockfd是否读就绪,我们不清楚
// 只有谁最清楚,未来sockfd上是否有事件就绪?select!
// 将新的sockfd,托管给select!
// 如何托管? 将新的fd放入辅助数组!
LOG(LogLevel::INFO) << "get a new link, sockfd: "
<< sockfd << ", client is: " << client.StringAddr();
int pos = 0;
for (; pos < size; pos++)
{
if (_fd_array[pos] == defaultfd)
break;
}
if (pos == size)
{
LOG(LogLevel::WARNING) << "select server full";
close(sockfd);
}
else
{
_fd_array[pos] = sockfd;
}
}
}
// IO处理器
void Recver(int fd, int pos)
{
char buffer[1024];
// 我在这里读取的时候,会不会阻塞?
ssize_t n = recv(fd, buffer, sizeof(buffer)-1, 0); // recv写的时候有bug吗?
if(n > 0)
{
buffer[n] = 0;
std::cout << "client say@ "<< buffer << std::endl;
}
else if(n == 0)
{
LOG(LogLevel::INFO) << "clien quit...";
// 1. 不要让select在关系这个fd了
_fd_array[pos] = defaultfd;
// 2. 关闭fd
close(fd);
}
else
{
LOG(LogLevel::ERROR) << "recv error";
// 1. 不要让select在关系这个fd了
_fd_array[pos] = defaultfd;
// 2. 关闭fd
close(fd);
}
}
void PrintFd()
{
std::cout << "_fd_array[]: ";
for (int i = 0; i < size; i++)
{
if (_fd_array[i] == defaultfd)
continue;
std::cout << _fd_array[i] << " ";
}
std::cout << "\r\n";
}
void Stop()
{
_isrunning = false;
}
~SelectServer()
{
}
private:
std::unique_ptr<Socket> _listensock;
bool _isrunning;
int _fd_array[size];
};