Nanomsg usock 模块：Socket 选项与错误码介绍

1、背景

在 Nanomsg 的 usock 模块中，正确理解和运用 Socket 选项以及处理各种错误码，是编写健壮、高性能网络程序的基础。本文将详细介绍 SO_NOSIGPIPE、SOCK_CLOEXEC、TCP_NODELAY 这几个关键选项，并对常见的 errno 枚举进行分类解析

2、关键 Socket 选项详解

2.1、SO_NOSIGPIPE：优雅地处理写入关闭的连接

在网络编程中，向一个已经被对端关闭的连接执行 write 或 send 操作时，系统默认会向进程发送 SIGPIPE 信号。如果不显式处理这个信号，进程的默认行为是终止。这对于库或长时间运行的服务来说是不可接受的，因为第三方库的一个错误使用就可能导致整个进程崩溃。SO_NOSIGPIPE 是一个 socket 选项，用于禁止在写入已关闭连接时产生 SIGPIPE 信号。设置该选项后，此类操作不再触发信号，而是让系统调用返回 -1 并设置 errno 为 EPIPE，示例代码如下：

c 复制代码

int enable = 1;
if (setsockopt(sock, SOL_SOCKET, SO_NOSIGPIPE, &enable, sizeof(enable)) < 0) {
    // 处理错误
}

在 Nanomsg 的 nn_usock_init_from_fd 函数中，正是通过此选项来避免 SIGPIPE 信号的干扰，确保错误能通过 errno 机制被上层捕获。需要注意的跨平台兼容性事项：

支持平台：SO_NOSIGPIPE 在 FreeBSD、macOS、DragonFlyBSD 等 BSD 衍生系统上得到良好支持
不支持平台：Linux 和 OpenBSD 不支持 SO_NOSIGPIPE 选项
Linux 替代方案：在 Linux 上，应使用 send 系统调用的 MSG_NOSIGNAL 标志：send(sock, buf, len, MSG_NOSIGNAL)，功能与 SO_NOSIGPIPE 相同

2.2、SOCK_CLOEXEC：防止文件描述符泄露

FD_CLOEXEC（File Descriptor Close-on-Exec）是一个文件描述符标志。当进程调用 exec 族函数执行新程序时，带有此标志的文件描述符会被自动关闭，从而防止意外泄露给子进程，传统做法是先创建 socket，再通过 fcntl 设置 FD_CLOEXEC

c 复制代码

int s = socket(AF_INET, SOCK_STREAM, 0);
fcntl(s, F_SETFD, FD_CLOEXEC);

在多线程环境中，如果在 socket() 和 fcntl() 之间进程调用了 fork() 和 exec()，子进程仍可能继承到这个未设置标志的 socket，存在安全风险。socket() 系统调用的 SOCK_CLOEXEC 标志（Linux 2.6.27+ 引入）解决了这个问题，允许在创建 socket 的同时原子性地设置 close-on-exec 标志

c 复制代码

int s = socket(AF_INET, SOCK_STREAM | SOCK_CLOEXEC, 0);

对于跨平台兼容性，在 Nanomsg 的实现中，采用了优雅的回退策略：

优先使用 SOCK_CLOEXEC：在支持的平台（主要是 Linux）上直接在 socket() 中指定
回退方式：如果不支持，则先创建 socket，再通过 fcntl 设置标志。虽然存在极小的竞态窗口，但在不支持原子操作的平台上这是唯一的办法

2.3、TCP_NODELAY：禁用 Nagle 算法

Nagle 算法是 TCP 协议中的一个优化机制，旨在减少网络上小数据包的数量。它的核心思想是：在未确认的 small packet 发出后，后续 small packet 会被缓冲，直到收到 ACK 或累积到足够大的段（MSS）。对于延迟敏感的应用（如游戏、实时通信、SSH），这会导致显著的延迟------数据已经准备好发送，却要等待 ACK 或凑满缓冲区。启用 TCP_NODELAY 后，Nagle 算法被禁用，TCP 会立即发送任何可用的数据，无论数据多小：

c 复制代码

int flag = 1;
setsockopt(sock, IPPROTO_TCP, TCP_NODELAY, &flag, sizeof(flag));

禁用 Nagle 算法是一把双刃剑：它的优点是显著降低延迟，小数据包能立即发送；缺点是可能产生大量微小数据包，增加网络拥塞风险和降低整体吞吐量。对于请求-响应模式的协议（如 HTTP），通常应该启用 TCP_NODELAY，对于批量数据传输，保持 Nagle 算法开启效率更高。

3、常见 errno 枚举分类

errno 是记录系统调用错误码的全局变量。C++11 标准库中提供了 std::errc 枚举类，对 POSIX 错误码进行了封装。

3.1、连接与地址相关

ECONNREFUSED，连接被拒绝，典型场景是目标端口没有进程监听
ETIMEDOUT ，连接超时，典型场景是多次重传无响应，或 keepalive 失败
EHOSTUNREACH，主机不可达，典型场景是路由不可达
ENETUNREACH，网络不可达，典型场景是网络故障
ECONNRESET，连接被对端重置，典型场景是对端崩溃或异常关闭，这是 epoll 中经常出现的错误
ECONNABORTED，连接被中止，典型场景是本端发送了 RST（通常由协议错误或超时引起），如 accept() 后连接断开
EADDRINUSE，地址已在使用，典型场景是bind() 时端口被占用
EADDRNOTAVAIL，地址不可用，典型场景是绑定的 IP 地址不存在

3.2、非阻塞操作相关

EAGAIN / EWOULDBLOCK，资源暂时不可用，操作会阻塞，典型场景是非阻塞模式下 recv 无数据，或 send 缓冲区满。这两个值通常是同一个整数
EINPROGRESS，操作正在进行中，典型场景是非阻塞 connect 正在建立连接，尚未完成
EALREADY，操作已经在进行中，典型场景是已经有一个非阻塞 connect 在进行，又尝试发起连接

3.3、资源与系统限制相关

EMFILE，进程级文件描述符不足，典型场景是当前进程打开的文件描述符数达到 ulimit -n 限制
ENFILE，系统级文件表已满，典型场景是整个系统的文件表被耗尽
ENOBUFS，内核缓冲区不足，典型场景是内存压力导致无法分配 socket 缓冲区
ENOMEM，内存不足，典型场景是系统内存耗尽

3.4、管道与流控制相关

EPIPE ，写入已关闭的连接，典型场景是向已收到 RST 的连接写入。如果未设置 SO_NOSIGPIPE，还会伴随 SIGPIPE 信号
ENOTCONN， socket 未连接，典型场景是在未连接的 socket 上调用 send 或 recv
EISCONN， socket 已连接，典型场景是，试图在已连接的 socket 上再次调用 connect

3.5、参数与协议错误

EINVAL，参数无效
ENOPROTOOPT，指定的 socket 选项级别或名称无效
EPROTONOSUPPORT，协议类型不受支持
EPROTOTYPE，socket 类型与协议不匹配
EMSGSIZE，消息过长，超过协议限制
EFAULT，传入的缓冲区地址无效

4、总结

Nanomsg usock 模块通过精细地运用这些选项和处理各类错误，构建了一个跨平台、非阻塞、高效可靠的异步 I/O 层。常用的SO_NOSIGPIPE、SOCK_CLOEXEC、TCP_NODELAY、EPIPE / ECONNRESET、EAGAIN / EINPROGRESS一定要牢记，EPIPE / ECONNRESET表示连接错误标识连接异常断开，EAGAIN / EINPROGRESS表示在非阻塞状态，操作需要等待，不是真正的错误。