Linux---＜unistd.h＞类Unix系统编程核心头文件

<unistd.h> 是 Unix 及类 Unix 系统（Linux、macOS、FreeBSD 等）的底层系统编程基石，属于 POSIX 1003.1 标准核心头文件。它封装了用户态程序与内核交互的核心接口，涵盖文件操作、进程管理、I/O 控制、系统配置等基础功能，是编写高性能系统级程序（如服务器、工具类软件）的必备依赖。

一、核心定位与兼容性说明

核心作用

＜unistd.h＞作为用户态与内核的"桥梁"，提供系统调用的函数声明、权限/常量定义、基础数据类型，避免直接操作内核接口，确保程序的可移植性与安全性。

历史与标准

起源：早期 Unix 系统的原生头文件，后被纳入 POSIX 标准，成为跨类 Unix 系统的统一接口规范。
兼容性：
✅ 所有类 Unix 系统（Linux/BSD/macOS）原生支持，函数行为遵循 POSIX 标准（细微实现差异可通过 _POSIX_VERSION 宏适配）；
❌ Windows 原生环境不支持（WSL、Cygwin 等兼容层可提供部分支持）。

二、核心宏定义与常量（含实用场景）

宏/常量	取值/类型	核心含义	典型使用场景
`STDIN_FILENO`	`int`（值=0）	标准输入文件描述符	配合 `read()` 读取终端输入
`STDOUT_FILENO`	`int`（值=1）	标准输出文件描述符	配合 `write()` 输出到终端
`STDERR_FILENO`	`int`（值=2）	标准错误文件描述符	输出程序错误信息（不被重定向影响）
`R_OK`/`W_OK`/`X_OK`	`int`（1/2/4）	`access()` 权限检查：可读/可写/可执行	程序启动前检查文件权限（如执行脚本）
`F_OK`	`int`（0）	`access()` 存在性检查：判断文件/目录是否存在	打开文件前验证路径有效性
`SEEK_SET`/`SEEK_CUR`/`SEEK_END`	`int`（0/1/2）	`lseek()` 偏移基准：文件开头/当前位置/文件结尾	读取文件指定位置内容、拓展文件大小
`NULL`	空指针常量	多数系统依赖 `<stddef.h>`，<unistd.h> 可能间接包含	指针初始化、函数参数占位（如 execl 结尾）
`_POSIX_VERSION`	长整型常量	支持的 POSIX 标准版本（如 200809L=POSIX.1-2008）	跨系统兼容性判断（如是否支持 `pipe2`）

注：宏的具体取值可能因系统略有差异，但语义完全遵循 POSIX 标准，无需硬编码数值。

三、文件操作核心函数

<unistd.h> 的文件操作直接对接内核文件系统，效率高于标准库（如 <stdio.h>），核心分为 4 类：

1. 权限与属性操作（文件元数据修改）

函数原型	核心功能	关键注意点
`int access(const char *path, int mode)`	检查文件权限/存在性	失败返回 -1，errno 标识原因（EACCES=权限不足，ENOENT=文件不存在）
`int chmod(const char *path, mode_t mode)`	修改文件权限（如 0644=用户读写、其他只读）	需文件所有者或 root 权限；mode 需用八进制（如 0755，而非 755）
`int chown(const char *path, uid_t uid, gid_t gid)`	修改所有者/所属组	仅 root 可修改所有者；普通用户可修改所属组（需属于该组）
`int fchmod(int fd, mode_t mode)`	通过文件描述符修改权限（无需路径解析，更高效）	适用于已打开的文件，避免重复路径查找

示例：检查文件是否可读并修改权限

c 复制代码

#include <unistd.h>
#include <stdio.h>

int main() {
    const char *file = "test.txt";
    // 检查文件是否存在且可读
    if (access(file, R_OK | F_OK) == -1) {
        perror("access failed");
        return 1;
    }
    // 修改权限为 0644（用户读写，组和其他只读）
    if (chmod(file, 0644) == -1) {
        perror("chmod failed");
        return 1;
    }
    printf("Permission updated successfully\n");
    return 0;
}

2. 文件描述符与读写操作（内核I/O核心）

文件描述符（fd）是内核分配的非负整数（0=stdin、1=stdout、2=stderr），是所有文件操作的"句柄"。

函数原型	核心功能	关键注意点
`int close(int fd)`	关闭文件描述符，释放内核资源	禁止重复关闭（未定义行为）；进程退出时未关闭的 fd 会被内核自动回收
`int dup2(int oldfd, int newfd)`	复制 oldfd 到 newfd（newfd 已打开则先关闭）	核心用途：实现重定向（如 stdout 重定向到文件）
`off_t lseek(int fd, off_t off, int whence)`	调整文件读写指针位置	返回新偏移量；支持拓展文件（如 whence=SEEK_END, off=1024 拓展文件到1024字节）
`ssize_t read(int fd, void *buf, size_t n)`	从 fd 读取最多 n 字节到 buf	返回实际读取字节数（0=EOF，-1=错误）；buf 需确保足够大且对齐
`ssize_t write(int fd, const void *buf, size_t n)`	写入 n 字节到 fd	返回实际写入字节数（可能小于 n，如磁盘满、网络缓存满）；需循环写入确保全部发送

示例1：dup2 实现 stdout 重定向到文件

c 复制代码

#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>

int main() {
    int fd = open("output.txt", O_WRONLY | O_CREAT | O_TRUNC, 0644);
    if (fd == -1) { perror("open failed"); return 1; }
    
    // 将 stdout（1）重定向到 fd（文件）
    dup2(fd, STDOUT_FILENO);
    close(fd); // 重定向后 fd 可关闭
    
    printf("This line will be written to output.txt\n"); // 不再输出到终端
    return 0;
}

示例2：lseek 读取文件指定位置内容

c 复制代码

#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
#include <string.h>

int main() {
    int fd = open("test.txt", O_RDONLY);
    if (fd == -1) { perror("open failed"); return 1; }
    
    // 移动指针到文件第 5 字节（从 0 开始）
    off_t new_pos = lseek(fd, 4, SEEK_SET);
    if (new_pos == -1) { perror("lseek failed"); return 1; }
    
    char buf[1024];
    ssize_t n = read(fd, buf, sizeof(buf)-1);
    if (n > 0) {
        buf[n] = '\0';
        printf("Content from offset 4: %s\n", buf);
    }
    close(fd);
    return 0;
}

3. 路径与目录操作

函数原型	核心功能	关键注意点
`char getcwd(char buf, size_t size)`	获取当前工作目录（CWD）	buf 为 NULL 时自动分配内存（需用 free 释放）；size 不足返回 NULL 并置 ENAMETOOLONG
`int chdir(const char *path)`	改变当前工作目录（仅影响调用进程）	子进程不会继承（如 fork 后子进程 CWD 与父进程一致）
`int mkdir(const char *path, mode_t mode)`	创建目录	mode 需结合 umask（默认 022）：实际权限 = mode & ~umask（如 mode 0777 → 0755）
`int rmdir(const char *path)`	删除空目录	非空目录需先删除所有内容（文件+子目录）
`int link(const char old, const char new)`	创建硬链接	硬链接与原文件共享 inode；不能跨文件系统；目录默认不允许创建硬链接
`int unlink(const char *path)`	删除硬链接（链接数为 0 则删除文件）	可删除正在被打开的文件（进程仍可读写，关闭后文件消失）
`int rename(const char old, const char new)`	重命名/移动文件/目录	原子操作（避免文件丢失）；可跨目录移动（需目标目录权限）

4. 数据持久化与文件截断

int fsync(int fd)：强制将文件缓存数据刷到磁盘（数据持久化），适用于数据库、日志系统（避免断电丢失数据）。
int ftruncate(int fd, off_t len)：将文件截断为 len 字节（短于原长度丢失数据，长于原长度补 0），适用于创建固定大小文件。

四、进程管理核心函数（Unix 进程模型基石）

<unistd.h> 定义了进程创建、切换、等待的核心接口，是多进程编程的基础。

1. 进程创建与程序替换

函数原型	核心功能	关键注意点
`pid_t fork(void)`	创建子进程（父子进程共享文件描述符、信号处理函数，内存写时复制 COW）	父进程返回子进程 PID，子进程返回 0，失败返回 -1；需通过返回值区分父子逻辑
`int execlp(const char file, const char arg0, ..., NULL)`	从 PATH 查找程序并替换当前进程（PID 不变）	参数列表以 NULL 结尾；`l=列表（可变参数）`，`p=PATH 查找`，`v=参数数组`，`e=自定义环境变量`
`void _exit(int status)`	立即终止进程（不清理缓冲区、不执行 atexit 函数）	与 `exit()`（标准库）的区别：`exit()` 会刷新缓冲区并调用 `_exit()`

示例：fork 创建子进程 + execlp 替换程序

c 复制代码

#include <unistd.h>
#include <stdio.h>
#include <sys/wait.h>

int main() {
    pid_t pid = fork();
    if (pid == -1) { perror("fork failed"); return 1; }
    
    if (pid == 0) { // 子进程
        printf("Child process (PID: %d) executing ls...\n", getpid());
        // 执行 ls -l（从 PATH 查找 ls，参数列表以 NULL 结尾）
        execlp("ls", "ls", "-l", NULL);
        perror("execlp failed"); // 仅当 execlp 失败时执行
        _exit(1);
    } else { // 父进程
        wait(NULL); // 等待子进程结束
        printf("Parent process (PID: %d) exiting...\n", getpid());
    }
    return 0;
}

2. 进程身份与优先级

函数原型	核心功能	关键注意点
`pid_t getpid()`/`getppid()`	获取当前进程 PID / 父进程 PID	父进程先退出时，子进程会成为"孤儿进程"，被 init（PID=1）收养
`uid_t getuid()`/`geteuid()`	实际用户 ID（进程所有者）/ 有效用户 ID（权限检查用）	SUID 程序（如 passwd）的 euid 为文件所有者（root），实现权限提升
`int nice(int incr)`	调整进程优先级（incr 正值降低优先级，负值提高）	普通用户只能降低优先级；root 可任意调整（nice 值范围：-20~19，值越小优先级越高）

3. 进程等待与信号

函数原型	核心功能	关键注意点
`pid_t wait(int *wstatus)`	阻塞等待任意子进程终止，通过 wstatus 获取退出状态	子进程成为"僵尸进程"后，需通过 wait/waitpid 回收资源
`pid_t waitpid(pid_t pid, int *wstatus, int opts)`	灵活等待（指定 PID、非阻塞）	pid=-1 等待所有子进程；opts=WNOHANG 非阻塞（无终止子进程时返回 0）
`unsigned int alarm(unsigned int sec)`	秒级定时器，sec 后发送 SIGALRM 信号	重复调用会覆盖之前的定时器；返回上次定时器剩余秒数
`int pause(void)`	阻塞进程直到收到信号（被中断后返回 -1，errno=EINTR）	常用于等待信号触发（如配合 signal 注册处理函数）

五、输入输出控制（终端/设备交互）

函数原型	核心功能	典型场景
`int isatty(int fd)`	判断 fd 是否指向终端设备（如 /dev/pts/0）	区分标准输入是终端还是文件重定向（如 `cat < file.txt` 时 stdin 非终端）
`char *ttyname(int fd)`	获取终端设备路径（如 /dev/tty1）	日志中记录程序所属终端
`int ioctl(int fd, unsigned long req, ...)`	设备特殊控制（终端、串口、网卡等）	获取终端窗口大小（TIOCGWINSZ）、配置串口波特率（TCSETS）

示例：判断 fd 是否为终端并获取终端路径

c 复制代码

#include <unistd.h>
#include <stdio.h>

int main() {
    if (isatty(STDIN_FILENO)) {
        printf("stdin is a terminal\n");
        char *tty = ttyname(STDIN_FILENO);
        if (tty) printf("Terminal path: %s\n", tty);
    } else {
        printf("stdin is not a terminal (redirected)\n");
    }
    return 0;
}

六、其他核心工具函数

函数原型	核心功能	关键注意点
`int pipe(int pipefd[2])`	创建匿名管道（pipefd[0]=读端，pipefd[1]=写端）	半双工通信；仅用于亲缘进程（父子/兄弟）间通信
`char getenv(const char name)`	获取环境变量值（如 PATH、HOME）	非线程安全；返回的指针不可修改（修改需用 setenv）
`int setenv(const char name, const char val, int overwrite)`	设置环境变量	overwrite=1 覆盖现有变量；0 则保留原有值
`long sysconf(int name)`	获取系统配置（如 _SC_PAGESIZE=内存页大小）	跨系统兼容（避免硬编码系统参数）
`unsigned int sleep(unsigned int sec)`	秒级休眠（可被信号中断，返回剩余秒数）	替代方案：`nanosleep()`（微秒级精度，可恢复中断）
`void *sbrk(intptr_t incr)`	调整堆大小（malloc 底层实现依赖）	不建议直接使用，优先用标准库内存分配函数（malloc/free）

七、注意事项

错误处理必须重视 ：

绝大多数函数失败返回 -1 并设置 errno（需包含 <errno.h>），建议用 perror() 或 strerror(errno) 打印具体错误（如权限不足、文件不存在）。
系统差异与弃用函数：
- 弃用函数：getwd() → 替代 getcwd()，usleep() → 替代 nanosleep()，vfork() → 替代 fork()（vfork 安全性问题）；
- 扩展函数：Linux 提供 pipe2()、dup3() 等增强版接口（需定义 _GNU_SOURCE），但非 POSIX 标准，跨系统需谨慎。
权限与安全限制：
- 修改文件所有者（chown）、提升优先级（nice 负值）、SUID 程序操作需 root 权限；
- 避免用 system() 执行外部命令（安全风险），优先用 fork()+exec() 替代。
线程安全问题 ：

非线程安全函数：getenv()、getcwd()（buf=NULL 时）、ttyname()，多线程环境需用互斥锁（pthread_mutex）同步，或使用线程安全变体（如 getenv_r()）。
文件描述符泄漏 ：

打开的 fd 必须关闭（close()），否则会耗尽系统最大文件描述符（sysconf(_SC_OPEN_MAX) 查看上限，默认通常为 1024）。

<unistd.h> 是类 Unix 系统编程的"入口"，封装了内核提供的核心系统调用，涵盖文件、进程、I/O、设备等底层能力。掌握它的关键在于：

理解函数的核心语义与返回值逻辑；
重视错误处理与系统兼容性；
结合 man 2 函数名（如 man 2 fork）查看系统具体实现细节。

无论是编写命令行工具、服务器程序还是嵌入式系统代码，<unistd.h> 都是不可或缺的基础，其设计思想（如文件描述符、进程模型）也是理解 Unix 系统的关键。