epoll 学习踩坑:`fcntl` 设置非阻塞到底用 `F_SETFL` 还是 `F_SETFD`?

文章目录

  • [epoll 学习踩坑:`fcntl` 设置非阻塞到底用 `F_SETFL` 还是 `F_SETFD`?](#epoll 学习踩坑:fcntl 设置非阻塞到底用 F_SETFL 还是 F_SETFD?)
    • [1. 先说结论:设置非阻塞用 `F_GETFL/F_SETFL`](#1. 先说结论:设置非阻塞用 F_GETFL/F_SETFL)
    • [2. 为什么 `F_SETFD | O_NONBLOCK` 不行?](#2. 为什么 F_SETFD | O_NONBLOCK 不行?)
    • [3. 那 `F_SETFD` 到底是干什么的?](#3. 那 F_SETFD 到底是干什么的?)
      • [✅ `FD_CLOEXEC`(close-on-exec)](#✅ FD_CLOEXEC(close-on-exec))
    • [4. 一句话记忆:FD vs FL](#4. 一句话记忆:FD vs FL)
    • [5. 推荐的"通用模板"函数](#5. 推荐的“通用模板”函数)
    • [6. 更现代的方式:创建时直接带上标志](#6. 更现代的方式:创建时直接带上标志)
    • [7. 这坑为什么在 epoll/ET 里更容易被放大?](#7. 这坑为什么在 epoll/ET 里更容易被放大?)
    • [8. 总结](#8. 总结)

epoll 学习踩坑:fcntl 设置非阻塞到底用 F_SETFL 还是 F_SETFD

最近在写 epoll 聊天室小项目时遇到一个非常"隐蔽但致命"的坑:我以为设置非阻塞就是 fcntl(fd, F_SETFD, ... | O_NONBLOCK),结果程序行为异常(ET 模式下丢事件、阻塞卡住、甚至表现得像没设置非阻塞一样)。最后才发现:设置 O_NONBLOCK 必须用 F_SETFL,不是 F_SETFD

这篇文章记录一下这个坑的本质原因、正确写法,以及 F_SETFD 到底是干什么的。


1. 先说结论:设置非阻塞用 F_GETFL/F_SETFL

O_NONBLOCK 属于"文件状态标志(file status flags)",所以只能通过 F_GETFL/F_SETFL 来获取/设置:

c 复制代码
int flags = fcntl(fd, F_GETFL, 0);
fcntl(fd, F_SETFL, flags | O_NONBLOCK);

这也是写 epoll + EPOLLET(边缘触发) 时最重要的基础之一:ET 模式必须配合 non-blocking + 循环读到 EAGAIN,否则很容易出现"读不干净就再也不通知"的错觉。


2. 为什么 F_SETFD | O_NONBLOCK 不行?

原因在于 fcntl 的第二个参数决定了你在操作哪一类标志位。下面这组宏很多人都见过:

c 复制代码
#define F_DUPFD  0   /* Duplicate file descriptor.  */
#define F_GETFD  1   /* Get file descriptor flags.  */
#define F_SETFD  2   /* Set file descriptor flags.  */
#define F_GETFL  3   /* Get file status flags.  */
#define F_SETFL  4   /* Set file status flags.  */

关键在注释:

  • F_GETFD / F_SETFD:file descriptor flags(描述符标志)
  • F_GETFL / F_SETFL:file status flags(状态标志)

O_NONBLOCK 并不属于 file descriptor flags,它属于 file status flags。

所以如果你写:

c 复制代码
fcntl(fd, F_SETFD, fcntl(fd, F_GETFD, 0) | O_NONBLOCK);

本质上是在对"描述符标志"做 OR 运算,但 O_NONBLOCK 根本不是这套标志体系里的成员。结果通常是:

  • 要么设置无效(最常见)
  • 要么直接报错(取决于内核/实现)

最终表现就是:你以为 fd 变成 non-block 了,实际上它还是阻塞 fd。


3. 那 F_SETFD 到底是干什么的?

F_SETFD 用来设置 "文件描述符标志(file descriptor flags)",最常见、也是最重要的一个就是:

FD_CLOEXEC(close-on-exec)

含义是:当进程调用 exec()(如 execve / execlp)把自己替换成另一个程序时,这个 fd 会自动关闭,避免 fd 泄漏到新程序里。

正确用法:

c 复制代码
int fdflags = fcntl(fd, F_GETFD);
fcntl(fd, F_SETFD, fdflags | FD_CLOEXEC);

这在服务端程序里非常常见:父进程打开了监听 socket、pipe、日志文件等,如果 fork 后子进程去 exec 启动别的程序,fd 泄漏会导致资源占用、管道 EOF 不出现、甚至安全风险。FD_CLOEXEC 就是解决这个问题的。

所以记住:
F_SETFD 是给 FD_CLOEXEC 这种"描述符级别标志"用的,不是给 O_NONBLOCK 用的。


4. 一句话记忆:FD vs FL

  • F_GETFD/F_SETFD:管 FD 标志 (例如 FD_CLOEXEC
  • F_GETFL/F_SETFL:管 FL 状态标志 (例如 O_NONBLOCK

非阻塞 → FL
close-on-exec → FD


5. 推荐的"通用模板"函数

写网络程序时我通常直接封装两个小函数,避免再搞混:

c 复制代码
#include <fcntl.h>
#include <stdlib.h>
#include <stdio.h>

static void set_nonblock(int fd) {
    int flags = fcntl(fd, F_GETFL, 0);
    if (flags == -1) { perror("fcntl F_GETFL"); exit(1); }
    if (fcntl(fd, F_SETFL, flags | O_NONBLOCK) == -1) {
        perror("fcntl F_SETFL"); exit(1);
    }
}

static void set_cloexec(int fd) {
    int flags = fcntl(fd, F_GETFD, 0);
    if (flags == -1) { perror("fcntl F_GETFD"); exit(1); }
    if (fcntl(fd, F_SETFD, flags | FD_CLOEXEC) == -1) {
        perror("fcntl F_SETFD"); exit(1);
    }
}

6. 更现代的方式:创建时直接带上标志

Linux 里很多系统调用支持"创建时就设置",减少遗漏和竞态:

  • epoll_create1(EPOLL_CLOEXEC)
  • accept4(..., SOCK_NONBLOCK | SOCK_CLOEXEC)
  • socket(..., SOCK_CLOEXEC)(部分平台支持)

例如:

c 复制代码
int epfd = epoll_create1(EPOLL_CLOEXEC);

这样就不用再额外 fcntl 设置 FD_CLOEXEC,更干净也更安全(尤其多线程场景下)。


7. 这坑为什么在 epoll/ET 里更容易被放大?

因为 ET 模式的正确姿势是:

  1. fd 必须 non-block
  2. 每次 EPOLLIN 触发要循环 read/accept 到 EAGAIN

如果你误用 F_SETFD,fd 其实还是阻塞的,那么:

  • 你循环读时可能直接卡住
  • 或者你不敢循环读,导致读不干净,下一次边沿不再触发
  • 最终表现为"epoll 很奇怪"、"ET 会丢事件"
    其实根本原因是:fd 根本没变成 non-block

8. 总结

  • 设置非阻塞:用 F_GETFL/F_SETFL + O_NONBLOCK
  • 设置 close-on-exec:用 F_GETFD/F_SETFD + FD_CLOEXEC
  • 学 epoll 尤其是 ET 时,先确保 non-block 真正生效,再谈"读到 EAGAIN"的正确模型
相关推荐
Trouvaille ~2 分钟前
【Linux】网络编程基础(二):数据封装与网络传输流程
linux·运维·服务器·网络·c++·tcp/ip·通信
2301_8223663518 分钟前
C++中的命令模式变体
开发语言·c++·算法
柱子jason26 分钟前
使用IOT-Tree Server模拟Modbus设备对接西门子PLC S7-200
网络·物联网·自动化·modbus·西门子plc·iot-tree·协议转换
每天要多喝水37 分钟前
nlohmann/json 的使用
c++·json
万邦科技Lafite44 分钟前
一键获取京东商品评论信息,item_reviewAPI接口指南
java·服务器·数据库·开放api·淘宝开放平台·京东开放平台
旅途中的宽~1 小时前
【深度学习】通过nohup后台运行训练命令后,如何通过日志文件反向查找并终止进程?
linux·深度学习
蓁蓁啊1 小时前
C/C++编译链接全解析——gcc/g++与ld链接器使用误区
java·c语言·开发语言·c++·物联网
D_evil__2 小时前
【Effective Modern C++】第四章 智能指针:19. 对于共享资源使用共享指针
c++
dump linux2 小时前
内核驱动调试接口与使用方法入门
linux·驱动开发·嵌入式硬件
czxyvX2 小时前
016-二叉搜索树(C++实现)
开发语言·数据结构·c++