计算机网络【EPoll原理】

预备知识:内核poll钩子原理
内核函数poll_wait

把当前进程加入到驱动里自定义的等待队列上 ;

当驱动事件就绪后,就可以在驱动里自定义的等待队列上唤醒调用poll的进程;

故poll_wait作用:可以让驱动知道事件就绪的时候唤醒哪些等待进程;

钩子poll

内核f_op->poll必须配合驱动自己的等待队列才能用,不然驱动有事件产生后不知道哪些进程调用了poll来等待这个事件。

内核f_op->poll要做的事情。

  • 调用poll_wait,将当前进程放入驱动设备的等待队列上,这样驱动就知道哪些进程在调用poll等待事件。
  • 检查此时立刻已有的事件(POLLIN\POLLOUT\POLLERR...)并返回掩码表示。

f_op->poll是一个非阻塞的操作,立即返回,返回值以掩码形式表示当前已产生的事件集合。

预备知识:等待队列

等待队列对头:wait_queue_head_t ;

队列的成员:wait_queue_t;

wait_queue_t的成员:

c++ 复制代码
void *private; /*指向进程描述符task_struct*/    
wait_queue_func_t  func;//唤醒时调用此函数,即钩子函数    
struct list_head  task_list;//队列链表指针

一般钩子函数func是内核默认函数default_wake_function,功能就是唤醒了进程。

我们也可以在把进程放入等待队列时主动设定钩子函数,使得在唤醒进程时自动执行我们需要的操作。

epoll就利用了队列钩子函数:把产生的事件内容copy到rdlist 。这样,事件来临时会自动把事件内容放到rdlist中,而不需要我们自己遍历监听句柄们查有谁产生了事件。

调用epoll_create1/epoll_create

创建了epoll句柄eventpoll,返回其文件表示的描述符epfd。

eventpoll内部有以下关键数据结构:

  • rbtree:红黑树,每个被加入到epoll监控的文件事件会创建一个epitem结构,作为rbtree节点 。

​ 使用rbtree的优点:可容纳大量文件事件,方便增删改(O(logN))。

  • rdlist:内核链表,用于存放当前产生了期待事件产生的文件句柄们(这里的一个文件句柄可以理解为一个epoll_event)。

  • wq:当进程调用epoll_wait等待时,进程加入等待队列wq。

  • poll_wait:eventpoll本身的等待队列,由于eventpoll自己也被当做文件,这个队列用于自己被别人调用select/poll/epoll监听的情况(一般没啥用)。

poll_wait在啥时候用呢:

c++ 复制代码
fd = socket(...);
efd1 = epoll_create();
efd2 = epoll_create();
epoll_ctl(efd1, EPOLL_CTL_ADD, fd, ...);
epoll_ctl(efd2, EPOLL_CTL_ADD, efd1, ...);

如上,efd1监控fd,而efd2监控了efd1,即嵌套的epoll监控:epoll监控另一个epoll句柄

efd2要监控efd1,将调用efd1的poll函数

回忆之前说过:文件f_op->poll需要配合驱动提供的等待队列

对于epollfd,等待队列就是poll_wait

efd2监听efd1,会调用efd1->f_op->poll,于是把当前进程放到efd1的poll_wait队列上

在epoll的内核实现中,当efd1本身监听到fd事件产生后,会顺便唤醒poll_wait上的进程

于是,"efd1监听到事件" 被通知到efd2。这样,就实现了epollfd被其他多路复用监听了!

故:poll_wait就是用于epoll句柄被另外的多路复用监听的,配合epoll自己的f_op->poll,看起来一般用不到

调用epoll_ctl操作句柄新增监控事件

epoll_ctl:EPOLL_CTL_ADD、EPOLL_CTL_MOD、EPOLL_CTL_DEL新增、修改、删除红黑树上的文件句柄。

其中epll_ctl:EPOLL_CTL_ADD新增句柄不仅仅新增红黑树节点,更关键的是对文件开始监控!

与select/poll的本质区别:并不是调用epoll_wait的时候才监听文件,而是EPOLL_CTL_ADD的时候就开始监听了。

epoll_ctl(epfd, EPOLL_CTL_ADD, fd, fdevent)核心流程:
  • 对要注册的事件event->events追加关心事件:EPOLLERR | EPOLLHUP。

​ 回忆epoll的使用中说过:EPOLLERR、EPOLLHUP事件会被自动监听,即使我们没设置。

  • 创建epitem结构,加入到红黑树中。

  • 【关键】revent = file->f_op->poll,即调用poll,把当前进程放到文件的等待队列上且设置回调函数ep_poll_callback,返回值revent是文件当前已产生事件掩码。

  • 检查返回事件:如果revent与关心事件event->events有交集(说明ADD之前事件就准备好了)。

    • 把此epitem节点拷贝到rdlist链表中;(就绪句柄拷贝到rdlist)。
    • 如果有进程在wq等待队列上(即有进程在调用epoll_wait等待),则唤醒之!
    • 顺便,如果有进程在poll_wait等待队列上(即有进程调用多路复用来监听当前epoll句柄),则唤醒之!

可以看到,如果在EPOLL_CTL_ADD一个文件之前,这个文件关心的事件就已经产生了的话,由于会唤醒wq队列上的进程,则此时EPOLL_CTL_ADD会使得epoll_wait函数从阻塞中返回。

再说回调函数干了什么

回调函数ep_poll_callback作为等待队列的回调函数:

当文件事件来临,唤醒文件等待队列上进程,ep_poll_callback函数将被自动调用,并把已产生事件们作为其参数传入。

回调函数ep_poll_callback核心流程:

ep_poll_callback检查已产生事件与关心事件是否有交集,如果有:

  • 将文件的epitem节点拷贝到rdlist链表上(就绪句柄拷贝到rdlist)。
  • 如果有进程在wq等待队列上(即有进程在调用epoll_wait等待),则唤醒之!
  • 顺便,如果有进程在poll_wait等待队列上(即有进程调用多路复用来监听当前epoll句柄),则唤醒之!

简而言之:回调函数把文件句柄拷贝到rdlist,并唤醒epoll_wait等待的进程。

当文件有事件来临时:
  1. 对应的等待队列上的进程被唤醒,执行回调函数ep_poll_callback,并把已产生事件们以参数传入;
  2. call ep_poll_callback;

简而言之:事件发生时,文件句柄被自动拷贝到rdlist,调用epoll_wait等待的进程们被唤醒。

调用epoll_wait等待事件

epoll_wait并不监听文件句柄,而是等待rdlist不空 or 收到信号 or 超时这三种条件后返回。

主要逻辑:

  1. 不断让出CPU,直到:
    • rdlist有数据;
    • 超时;
    • 收到信号;
  2. 如果rdlist有数据,则拷贝到用户传入的events数组。

简而言之:等待rdlist不空或者超时、信号中断,rdlist不空则把句柄们拷贝到用户空间。

拷贝到用户这个环节看边缘触发与水平触发的区别

拷贝句柄函数ep_send_events会先遍历rdlist中每个句柄,对于每个句柄,再次调用poll获取实际事件:

如果与关心事件有交集:

  • 如果句柄是水平触发(EPOLLLT),则再次把句柄加入到rdlist;否则从rdlist中删除。

于是水平模式下次还会准备好,这就是EPOLLET 与 EPOLLLT的区别原理。

  • 如果与关心事件无交集,从rdlist中删除之。

问题:如此一来看起来水平模式的句柄永远都不断重新加入rdlist,这就成永远都通知了吧?

当事件已经被处理完后,调用poll得到的实际事件与关心事件已经无交集了,于是会被删除的!

ep_send_events函数内再次调用poll获取实际事件就是为了EPOLLLT模式而生的,防止其永远加入rdlist!

相关推荐
zquwei4 分钟前
SpringCloudGateway+Nacos注册与转发Netty+WebSocket
java·网络·分布式·后端·websocket·网络协议·spring
Aimin202218 分钟前
路由器做WPAD、VPN、透明代理中之间一个
网络
群联云防护小杜39 分钟前
如何给负载均衡平台做好安全防御
运维·服务器·网络·网络协议·安全·负载均衡
爱码小白1 小时前
网络编程(王铭东老师)笔记
服务器·网络·笔记
蜜獾云1 小时前
linux firewalld 命令详解
linux·运维·服务器·网络·windows·网络安全·firewalld
柒烨带你飞1 小时前
路由器转发数据报的封装过程
网络·智能路由器
背着黄油面包的猫2 小时前
计算机网络基础知识
计算机网络
唐宋元明清21882 小时前
Windows 记录开机后应用启动慢的问题
windows·系统异常
东方隐侠安全团队-千里2 小时前
网安瞭望台第17期:Rockstar 2FA 故障催生 FlowerStorm 钓鱼即服务扩张现象剖析
网络·chrome·web安全
神一样的老师3 小时前
面向高精度网络的时间同步安全管理架构
网络·安全·架构