TCP IP 网络编程(七) 理解select和epoll的使用

文章目录

理解select函数

select函数的功能和调用顺序

使用select函数可以将多个文件描述符集中到一起统一监视

  • 是否存在套接字接收数据
  • 无需阻塞传输数据的套接字有哪些
  • 哪些套接字发生了异常

select函数的调用方法和顺序

  • 设置文件描述符
  • 指定监视范围
  • 设置超时

​ ↓

  • 调用select函数

    ​ ↓

  • 查看调用结果

设置文件描述符

利用select函数可以同时监视多个文件描述符,监视文件门描述符也可以视为监视套接字,首先需要将要监视的文件描述符集中到一起。集中时也要按照监视项(接收、传输、异常)进行区分

  • FD_ZERO(fd_set * fdset) 将fd_set变量都初始化为0
  • FD_SET(int fd,fd_set *fdset) 在参数fdset指向的变量注册文件描述符fd的信息
  • FD_CLR(int fd, fd_set * fdset) 从参数fdset指向的变量中清楚文件描述符fd的信息
  • FD_ISSET(int fd , fd_set * fdset)若参数fdset指向的变量中包含文件描述符fd的信息,则返回 真

c 复制代码
int main(void)
{
    fd_set set;
    
    FD_ZERO(&set);			0 0 0 0 ....
    
    FD_SET(1,&set);			0 1 0 0 ....
    
    FD_SET(2,&set);			0 1 1 0 ....
    
    FD_CLR(2,&set);			0 1 0 0 ....
}

设置监视范围及超时

c++ 复制代码
#include <sys/select.h>
#include <sys/time.h>

int select(int maxfd, fd_set * readset,fd_set *writeset,fd_set exceptset,const struct timeval * timeout);

	成功返回大于 0 的值,失败返回 - 1
    
    maxfd		监视文件描述符的数量
    readset		将所有关注是否存在待读取数据的文件描述符注册到fd_set型变量,并传递到其地址值
   	writeset 	将所有关注是否可传无阻塞数据的文件描述符注册到fd_set型变量,并传递到其地址值
    exceptset   将所有关注是否发生异常的文件描述符注册到fd_set型变量,并传递其地址值
    timeout 	调用select函数后,为防止陷入无限阻塞的状态,传递超时time - out消息

文件描述符的监视范围与select函数的第一个参数有关,select要求通过第一个参数传递监视对象文件描述符的数量

select函数的超时时间与select函数的最后一个参数有关,其中timeval结构体定义为:

c++ 复制代码
struct timeval
{
    long tv_sec;    	//秒
    long tv_usec;       //微秒
}

select函数只有在监视的文件描述符发生变化时才返回,如果未发生变化,就会进到阻塞状态。指定超时时间就是为了这种情况的发生,通过上述结构体变量,将秒数填入tv_sec成员,微秒数填入tv_usec成员,将结构体的地址值传递到select函数的最后一个参数,不想设置超时时间,直接传递NULL。

select函数调用示例

c++ 复制代码
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <sys/time.h>
#include <sys/select.h>

#define BUF_SIZE 100
void error_handling(char *buf);

int main(int argc, char *argv[])
{
	int serv_sock, clnt_sock;
	struct sockaddr_in serv_adr, clnt_adr;
	struct timeval timeout;
	fd_set reads, cpy_reads;

	socklen_t adr_sz;
	int fd_max, str_len, fd_num, i;
	char buf[BUF_SIZE];
	if(argc!=2) {
		printf("Usage : %s <port>\n", argv[0]);
		exit(1);
	}

	serv_sock=socket(PF_INET, SOCK_STREAM, 0);
	memset(&serv_adr, 0, sizeof(serv_adr));
	serv_adr.sin_family=AF_INET;
	serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);
	serv_adr.sin_port=htons(atoi(argv[1]));
	
	if(bind(serv_sock, (struct sockaddr*) &serv_adr, sizeof(serv_adr))==-1)
		error_handling("bind() error");
	if(listen(serv_sock, 5)==-1)
		error_handling("listen() error");

	FD_ZERO(&reads);
	FD_SET(serv_sock, &reads);
	fd_max=serv_sock;

	while(1)
	{
		cpy_reads=reads;
		timeout.tv_sec=5;
		timeout.tv_usec=5000;

		if((fd_num=select(fd_max+1, &cpy_reads, 0, 0, &timeout))==-1)
			break;
		
		if(fd_num==0)
			continue;

		for(i=0; i<fd_max+1; i++)
		{
			if(FD_ISSET(i, &cpy_reads))
			{
				if(i==serv_sock)     // connection request!
				{
					adr_sz = sizeof(clnt_adr);
					clnt_sock = accept(serv_sock, (struct sockaddr*)&clnt_adr, &adr_sz);
					FD_SET(clnt_sock, &reads);
					if(fd_max<clnt_sock)
						fd_max=clnt_sock;
					printf("connected client: %d \n", clnt_sock);
				}
				else    // read message!
				{
					str_len=read(i, buf, BUF_SIZE);
					if(str_len==0)    // close request!
					{
						FD_CLR(i, &reads);
						close(i);
						printf("closed client: %d \n", i);
					}
					else
					{
						write(i, buf, str_len);    // echo!
					}
				}
			}
		}
	}
	close(serv_sock);
	return 0;
}

void error_handling(char *buf)
{
	fputs(buf, stderr);
	fputc('\n', stderr);
	exit(1);
}

优于select的epoll

epoll 在内核里使用「红黑树」来关注进程所有待检测的 Socket,红黑树是个高效的数据结构,增删改一般时间复杂度是 O(logn),通过对这棵黑红树的管理,不需要像 select/poll 在每次操作时都传入整个 Socket 集合,减少了内核和用户空间大量的数据拷贝和内存分配。

epoll 使用事件驱动的机制,内核里维护了一个「链表」来记录就绪事件,只将有事件发生的 Socket 集合传递给应用程序,不需要像 select/poll 那样轮询扫描整个集合(包含有和无事件的 Socket ),大大提高了检测的效率。

基于select的I/O复用速度慢

  • 调用select函数后常见的针对所有文件描述符的循环语句
  • 每次调用select时都需要向该函数传递监视对象信息

相比于select,epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。

因为在内核中的select实现中,它是采用轮询来处理的,轮询的fd数目越多,自然耗时越多。

实现epoll时必要的函数和结构体

  • epoll_create: 创建保存epoll文件描述符的空间
  • epoll_ctl: 向空间注册并注销文件描述符
  • epoll_wait: 等待文件描述符发生变化

为添加和删除监视对象文件描述符,select方式中需要FD_SET、FD_CLR函数,但是在epoll中都是通过epoll_ctl函数请求操作系统完成

select方式中调用select等待文件描述符的变化,而epoll调用epoll_wait函数。

select方式中通过fd_set变量查看监视对象的状态变化,而epoll_wait方式通过结构体epoll_event将发生变化的文件描述符集中一起

c++ 复制代码
    struct epoll_event {
      __uint32_t events; 
     epoll_data_t data; 
	};


     typedef union epoll_data {
      void *ptr;
      int fd;
      __uint32_t u32;
      __uint64_t u64;
  } epoll_data_t;

events可以是以下几个宏的集合:

  • EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭);
  • EPOLLOUT:表示对应的文件描述符可以写;
  • EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
  • EPOLLERR:表示对应的文件描述符发生错误;
  • EPOLLHUP:表示对应的文件描述符被挂断;
  • EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。
  • EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还监听这个socket的话,再次把这个socket加入到EPOLL队列

epoll_create

c++ 复制代码
#include <sys/epoll.h>

int epoll_create(int size);

	成功返回epoll文件描述符,失败返回 - 1

创建一个epoll的描述符,size用来告诉内核这个监听数目一共多大,此参数不同于select()中的第一个参数,给出最大监听的fd+1的值

当创建好epoll描述符后,它就是会占用一个fd值,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。

epoll_ctl

c++ 复制代码
#include <sys/epoll.h>

int epoll_ctl(int epfd, int op, int fd, struct epoll_event * event);
	
	成功返回0,失败时返回-1
        epfd 	用于注册监视对象的epoll例程的文件描述符
        op		用于指定监视对象的添加、删除、更改操作 
        			↓
        	EPOLL_CTL_ADD:注册新的fd到epfd中;
			EPOLL_CTL_MOD:修改已经注册的fd的监听事件;
			EPOLL_CTL_DEL:从epfd中删除一个fd;
        fd		需要注册的监视对象文件描述符
        event 	监视对象的事件类型

epoll_wait

c++ 复制代码
#include <sys/epoll.h>

int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
	成功返回时间的文件描述符,失败返回-1
        epfd		时间发生监视范围的epoll例程的文件描述符
        events		保存时间的文件描述符集合的结构体地址值 (缓冲需要动态分配)
        maxevents	第二个参数可以保存的最大事件数
        timeout		以毫秒为单位,传递-1,一直等待发送事件。

基于epoll的服务器端

c++ 复制代码
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <sys/epoll.h>

#define BUF_SIZE 100
#define EPOLL_SIZE 50
void error_handling(char *buf);

int main(int argc, char *argv[])
{
	int serv_sock, clnt_sock;
	struct sockaddr_in serv_adr, clnt_adr;
	socklen_t adr_sz;
	int str_len, i;
	char buf[BUF_SIZE];

	struct epoll_event *ep_events;
	struct epoll_event event;
	int epfd, event_cnt;

	if(argc!=2) {
		printf("Usage : %s <port>\n", argv[0]);
		exit(1);
	}

	serv_sock=socket(PF_INET, SOCK_STREAM, 0);
	memset(&serv_adr, 0, sizeof(serv_adr));
	serv_adr.sin_family=AF_INET;
	serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);
	serv_adr.sin_port=htons(atoi(argv[1]));
	
	if(bind(serv_sock, (struct sockaddr*) &serv_adr, sizeof(serv_adr))==-1)
		error_handling("bind() error");
	if(listen(serv_sock, 5)==-1)
		error_handling("listen() error");

	epfd=epoll_create(EPOLL_SIZE);
	ep_events=malloc(sizeof(struct epoll_event)*EPOLL_SIZE);

	event.events=EPOLLIN;
	event.data.fd=serv_sock;	
	epoll_ctl(epfd, EPOLL_CTL_ADD, serv_sock, &event);

	while(1)
	{
		event_cnt=epoll_wait(epfd, ep_events, EPOLL_SIZE, -1);
		if(event_cnt==-1)
		{
			puts("epoll_wait() error");
			break;
		}

		for(i=0; i<event_cnt; i++)
		{
			if(ep_events[i].data.fd==serv_sock)
			{
				adr_sz=sizeof(clnt_adr);
				clnt_sock=
					accept(serv_sock, (struct sockaddr*)&clnt_adr, &adr_sz);
				event.events=EPOLLIN;
				event.data.fd=clnt_sock;
				epoll_ctl(epfd, EPOLL_CTL_ADD, clnt_sock, &event);
				printf("connected client: %d \n", clnt_sock);
			}
			else
			{
					str_len=read(ep_events[i].data.fd, buf, BUF_SIZE);
					if(str_len==0)    // close request!
					{
						epoll_ctl(
							epfd, EPOLL_CTL_DEL, ep_events[i].data.fd, NULL);
						close(ep_events[i].data.fd);
						printf("closed client: %d \n", ep_events[i].data.fd);
					}
					else
					{
						write(ep_events[i].data.fd, buf, str_len);    // echo!
					}
	
			}
		}
	}
	close(serv_sock);
	close(epfd);
	return 0;
}

void error_handling(char *buf)
{
	fputs(buf, stderr);
	fputc('\n', stderr);
	exit(1);
}

边缘触发和水平触发

epoll 支持两种事件触发模式,分别是边缘触发(edge-triggered,ET)和 水平触发(level-triggered,LT)

这两个术语还挺抽象的,其实它们的区别还是很好理解的。

  • 使用边缘触发模式时,当被监控的 Socket 描述符上有可读事件发生时,服务器端只会从 epoll_wait 中苏醒一次,即使进程没有调用 read 函数从内核读取数据,也依然只苏醒一次,因此我们程序要保证一次性将内核缓冲区的数据读取完;
  • 使用水平触发模式时,当被监控的 Socket 上有可读事件发生时,服务器端不断地从 epoll_wait 中苏醒,直到内核缓冲区数据被 read 函数读完才结束,目的是告诉我们有数据需要读取;

举个例子,你的快递被放到了一个快递箱里,如果快递箱只会通过短信通知你一次,即使你一直没有去取,它也不会再发送第二条短信提醒你,这个方式就是边缘触发;如果快递箱发现你的快递没有被取出,它就会不停地发短信通知你,直到你取出了快递,它才消停,这个就是水平触发的方式。

这就是两者的区别,水平触发的意思是只要满足事件的条件,比如内核中有数据需要读,就一直不断地把这个事件传递给用户;而边缘触发的意思是只有第一次满足条件的时候才触发,之后就不会再传递同样的事件了。

如果使用水平触发模式,当内核通知文件描述符可读写时,接下来还可以继续去检测它的状态,看它是否依然可读或可写。所以在收到通知后,没必要一次执行尽可能多的读写操作。

如果使用边缘触发模式,I/O 事件发生时只会通知一次,而且我们不知道到底能读写多少数据,所以在收到通知后应尽可能地读写数据,以免错失读写的机会。因此,我们会循环 从文件描述符读写数据,那么如果文件描述符是阻塞的,没有数据可读写时,进程会阻塞在读写函数那里,程序就没办法继续往下执行。所以,边缘触发模式一般和非阻塞 I/O 搭配使用 ,程序会一直执行 I/O 操作,直到系统调用(如 readwrite)返回错误,错误类型为 EAGAINEWOULDBLOCK

一般来说,边缘触发的效率比水平触发的效率要高,因为边缘触发可以减少 epoll_wait 的系统调用次数,系统调用也是有一定的开销的的,毕竟也存在上下文的切换。

select/poll 只有水平触发模式,epoll 默认的触发模式是水平触发,但是可以根据应用场景设置为边缘触发模式。

参考资料:

https://xiaolincoding.com/


更多资料尽在 GitHub 欢迎各位读者去Star

⭐学术交流群Q 754410389 持续更新中~~~

相关推荐
网络研究院1 小时前
如何安全地大规模部署 GenAI 应用程序
网络·人工智能·安全·ai·部署·观点
limengshi1383921 小时前
通信工程学习:什么是RIP路由信息协议
网络·网络协议·学习·智能路由器·信息与通信
GodK7772 小时前
HTTPS 的加密流程
网络协议·http·https
limengshi1383925 小时前
通信工程学习:什么是TFTP简单文件传输协议
网络·网络协议·学习·信息与通信
麻辣韭菜7 小时前
网络基础 【HTTP】
网络·c++·http
Deryck_德瑞克8 小时前
Java网络通信—TCP
java·网络·tcp/ip
GodK7778 小时前
IP 数据包分包组包
服务器·网络·tcp/ip
千年死缓8 小时前
go+redis基于tcp实现聊天室
redis·tcp/ip·golang
梁诚斌8 小时前
VSOMEIP代码阅读整理(1) - 网卡状态监听
运维·服务器·网络
ZachOn1y10 小时前
计算机网络:计算机网络概述 —— 描述计算机网络的参数
网络·tcp/ip·计算机网络·考研必备