IO复用详解——C/C++

IO复用

在Linux网络编程中,I/O复用 是处理高并发连接的核心技术。它允许单个线程/进程同时监控多个文件描述符(如Socket)的可读/可写状态,避免为每个连接创建独立线程的资源浪费。以下是 selectpollepoll 的详细对比与实现方法:


1. I/O复用核心概念

  • 阻塞I/O:线程等待数据就绪,期间无法执行其他操作。
  • 非阻塞I/O:轮询检查数据是否就绪,浪费CPU资源。
  • I/O复用 :通过系统调用统一监控多个I/O事件,仅处理就绪的I/O。

2. select

原理

  • 使用**位图(fd_set)**表示监控的文件描述符集合。

    c 复制代码
    typedef struct {
        unsigned long fds_bits[FD_SETSIZE / (8 * sizeof(unsigned long))];
    } fd_set;
    • FD_SETSIZE

      是一个宏,定义了 fd_set 可容纳的最大文件描述符数量,默认值通常为 1024

    • fds_bits

    • 每个文件描述符对应一个位。

    • 位为 1:表示文件描述符在集合中。

    • 位为 0:表示文件描述符不在集合中。

    功能描述
    FD_ZERO(fd_set *set) 清空集合,将所有位设为 0。
    FD_SET(int fd, fd_set *set) 将文件描述符 fd 添加到集合中(对应位设为 1)。
    FD_CLR(int fd, fd_set *set) 从集合中移除文件描述符 fd(对应位设为 0)。
    FD_ISSET(int fd, fd_set *set) 检查 fd 是否在集合中,返回值为 1(存在)或 0(不存在)。
  • 每次调用时需将所有fd集合从用户态拷贝到内核态,内核通过线性扫描判断就绪状态。

  • 支持跨平台(Windows/Linux)。

代码示例

cpp 复制代码
#include <sys/select.h>

int main() {
    fd_set read_fds;
    FD_ZERO(&read_fds);     // 清空集合
    FD_SET(sock_fd, &read_fds); // 添加sock_fd到监控集合

    struct timeval timeout;
    timeout.tv_sec = 5;     // 超时时间5秒
    timeout.tv_usec = 0;

    // 调用select,监控可读事件
    int ret = select(sock_fd + 1, &read_fds, NULL, NULL, &timeout);
    if (ret > 0) {
        if (FD_ISSET(sock_fd, &read_fds)) {
            // 处理数据读取
        }
    }
}

优缺点

  • 优点:跨平台兼容。
  • 缺点
    • 最大支持 FD_SETSIZE(通常1024)个文件描述符。
    • 每次调用需重置fd集合,存在内存拷贝开销。
    • 线性扫描效率低(时间复杂度O(n))。

3. poll

原理

  • 使用**结构体数组(pollfd)**替代select的位图,突破文件描述符数量限制。
  • 仍需要遍历所有fd检查就绪状态。

代码示例

cpp 复制代码
#include <poll.h>

int main() {
    struct pollfd fds[1];
    fds[0].fd = sock_fd;      // 监控的fd
    fds[0].events = POLLIN;   // 监控可读事件

    // 调用poll,超时时间5秒
    int ret = poll(fds, 1, 5000);
    if (ret > 0) {
        if (fds[0].revents & POLLIN) {
            // 处理数据读取
        }
    }
}

优缺点

  • 优点:无文件描述符数量限制。
  • 缺点
    • 仍需遍历所有fd,效率随连接数线性下降。
    • 每次调用需传递完整的fd数组。

4. epoll(Linux特有)

原理

  • 使用红黑树 管理待监控的fd,事件驱动机制。
  • **边缘触发(ET) 水平触发(LT)**两种模式。
    • LT模式(默认):只要fd处于就绪状态,每次epoll_wait都会通知。
    • ET模式:仅当fd状态变化时通知一次,需一次性处理完数据。

代码示例

cpp 复制代码
#include <sys/epoll.h>

int main() {
    int epoll_fd = epoll_create1(0); // 创建epoll实例
    struct epoll_event event;
    event.events = EPOLLIN;         // 监控可读事件
    event.data.fd = sock_fd;

    // 添加sock_fd到epoll监控
    epoll_ctl(epoll_fd, EPOLL_CTL_ADD, sock_fd, &event);

    struct epoll_event events[10];
    // 等待事件,超时时间5秒
    int ret = epoll_wait(epoll_fd, events, 10, 5000);
    if (ret > 0) {
        for (int i = 0; i < ret; i++) {
            if (events[i].data.fd == sock_fd) {
                // 处理数据读取
            }
        }
    }
}

优缺点

  • 优点
    • 支持海量连接(时间复杂度O(1))。
    • 无需每次传递全部fd,通过事件回调机制高效通知。
  • 缺点:仅适用于Linux系统。

5. 对比总结

特性 select poll epoll
最大连接数 1024 无限制 无限制
效率 O(n) 线性扫描 O(n) 线性扫描 O(1) 事件驱动
内存拷贝 每次拷贝全部fd集合 每次拷贝全部fd数组 仅注册时拷贝一次
触发模式 水平触发(LT) 水平触发(LT) 支持LT/ET模式
跨平台 是(多数系统) 仅Linux

6. 应用场景建议

  • select/poll:低并发场景或需要跨平台时使用。
  • epoll:Linux高并发服务器(如Web服务器、即时通讯)。
  • Windows替代方案:IOCP(I/O Completion Ports)。

7. 注意事项

  1. ET模式 需一次性读取所有数据(循环读取直到EAGAIN错误)。
  2. fd管理 :epoll需手动管理fd的增删(EPOLL_CTL_ADD/DEL/MOD)。
  3. 多线程:epoll实例本身非线程安全,需加锁或每个线程独立实例。

I/O复用技术是构建高性能服务器的关键!

相关推荐
Mr_Chenph11 分钟前
Miniconda3在Windows11上和本地Python共生
开发语言·python·miniconda3
阿狸远翔12 分钟前
Protobuf 和 protoc-gen-go 详解
开发语言·后端·golang
永远前进不waiting12 分钟前
C复习——1
c语言·开发语言
阿闽ooo15 分钟前
深入浅出适配器模式:从跨国插头适配看接口兼容的艺术
c++·设计模式·适配器模式
伯明翰java23 分钟前
Java数据类型与变量
java·开发语言
一路往蓝-Anbo24 分钟前
【第13期】中断机制详解 :从向量表到ISR
c语言·开发语言·stm32·单片机·嵌入式硬件
渣渣盟31 分钟前
Linux邮件服务器快速搭建指南
linux·服务器·开发语言
BD_Marathon1 小时前
Promise基础语法
开发语言·前端·javascript
Aotman_2 小时前
JavaScript MutationObserver用法( 监听DOM变化 )
开发语言·前端·javascript·vue.js·前端框架·es6
Bruce_Liuxiaowei2 小时前
Nmap+Fofa 一体化信息搜集工具打造
运维·开发语言·网络·网络安全