一、I/O多路复用
1、为什么要多路复用
之前开启多线程能实时接收数据,并且也不是一次性连接服务。但毕竟是一请求一连接,每有一个客户端向服务端发起请求,就会创建一个线程,当请求达到上千上万,就会创建上千上万的线程,虽然线程所占资源很少,但也架不住数量多,会给系统内核资源调度增加负担<不利于高并发>
2、解决单个线程处理多个I/O操作问题
系统提供3种策略来解决,分别是select,poll,epoll
二、select机制
1、将多个线程请求看成是一个集合
2、关注集合中的fd哪些可读,可写,可出错
3、逐个管理集合中的fd,如果有数据到来就进行处理,否则就继续阻塞等待。
4、遍历集合中的fd,判断是否可读,可读就接收。
三、具体实操
在之前的阻塞I/O中,我们是阻塞在accept上,现在我们阻塞在select上。
所以在之前的代码中,将accept及以下代码进行更换。
1、创建集合,清空集合,设置集合
c++
fd_set rfds, rset; //集合
FD_ZERO(&rfds); //对集合进行清空
FD_SET(socketfd, &rfds); //对集合进行设置,将客户端fd添加至集合中
2、阻塞在select上
select函数原型:
c++
int select(int nfds, fd_set *readfds, fd_set *writefds,fd_set *exceptfds, struct timeval *timeout);
/*
nfds: 集合最大边界值 + 1,因为从0开始
readfds: 关注这部分(如4,5,6)fd是否可读
writefds: 关注这部分(如7,8,9)fd是否可写
exceptfds:关注这部分(如7,8,9)fd是否出错
timeout: 超时时间,NULL表示永久阻塞,非NULL表示等待时间,单位为秒
return value: 返回的是所关注的共达标多少个,如可读3个,可写2个,可出错1个,共计6个
*/
c++
int maxfd = socketfd; //对集合遍历的最大值,集合也有边界,从0开始
while(true){
rset = rfds; //复制一份集合,防止在select中被修改
int nready = select(maxfd + 1, &rset, NULL, NULL, NULL); //等待IO就绪
if(nready < 0){ //出错处理
cout << "select error:" << strerror(errno) << endl;
continue;
}else if (nready == 0){ //超时处理
cout << "timeout\n";
continue;
}else{
//accept操作,此处省略
}
//recv操作,此处省略
}
3、管理逐个IO,accept操作
c++
if(FD_ISSET(socketfd, &rset)){ //如果有数据到来,则进行接收处理====accept
int clientfd = accept(socketfd, (struct sockaddr *)&clientaddr, &len);
cout<<"clientfd:"<<clientfd<<endl; //获取到客户端的连接描述符
FD_SET(clientfd, &rfds); //将新的连接加入到集合中
if(clientfd > maxfd){ //更新遍历的边界,回收旧的连接,更新边界值
maxfd = clientfd;
}
}
4、recv操作,判断是否可读,接收数据
c++
for(int i = socketfd + 1; i <= maxfd; i++){
if(FD_ISSET(i, &rset)){ //判断IO是否可读
char buffer[1024] = {0};
int count = recv(i, buffer, 1024, 0);
if(count == 0){
close(i);
FD_CLR(i, &rfds);
continue;
}
cout << "buffer:" << buffer << endl;
//返回信息
count = send(i, buffer, count, 0);
}
}

5、小结:
一个线程多路I/O,阻塞在select上,当有客户端连接时,select返回,再进行accept操作。
select主要用到
c++
fd_set //集合
FD_SET //设置集合,将fd加入到集合中
FD_CLR //清除集合,将fd从集合中移除
FD_ISSET //判断IO是否可读
FD_ZERO //初始化为空集合
select //阻塞等待IO就绪
相比于之前的网络I/O,避免了多线程的开销, select解决了单个线程处理多个I/O的问题。
但是,select还是有缺陷的。select,每次调用都需要把fd_set集合,从用户空间拷贝到内核空间,随着fd越来越大,拷贝的开销比较大。
maxfd,遍历到最大的fd。
6、扩展问题:
1、fd_set究竟是什么?
c++
#define FD_SETSIZE 1024 // 假设文件描述符集合的最大大小为1024
typedef struct {
unsigned long fds_bits[FD_SETSIZE / (8 * sizeof(unsigned long))];
} fd_set;
可见fd_set本质是一个位图,每个fd对应一个bit位。
2、集合大小是多少,能修改吗?
集合大小可以通过宏定义修改,但是不建议修改。