POSIX 低级 I/O 核心内容

二、POSIX 低级 I/O 核心内容

定义与适用场景
- POSIX（Portable Operating System Interface）：多数 UNIX 系统支持的低级文件访问 API，是 C 标准库的底层实现基础。
- 必学原因：需用于目录操作和网络 I/O，无法用 C 标准库替代。
核心函数与用法
- open()/close() ：打开 / 关闭文件，需包含<fcntl.h>（open ()）和<unistd.h>（close()）。
  - 示例：int fd = open("foo.txt", O_RDONLY);，失败返回 - 1，需用 perror () 打印错误。
  - 文件描述符：默认 3 个（0 = 标准输入、1 = 标准输出、2 = 标准错误），本质是 int 类型标识符。
- read() ：读取文件数据，原型ssize_t read(int fd, void* buf, size_t count)。
  - 返回值：成功返回读取字节数（可能少于 count）、0 表示 EOF、-1 表示错误（需检查 errno）。
  - 常见错误：EBADF（无效文件描述符）、EFAULT（缓冲区地址无效）、EINTR（调用被中断，需重试）。
  - 正确读取逻辑：循环读取直至 bytes_left 为 0，处理 EINTR 错误，缓冲区偏移计算为buf + (n - bytes_left)。
- 其他函数：write ()（写入数据）、lseek ()（移动文件指针）、fsync ()（刷新数据到硬件）、opendir ()/readdir ()/closedir ()（目录操作，需查 man 3 手册）。

与 C 标准库的对比

特性	POSIX 低级 I/O	C 标准库（glibc）
缓冲机制	无缓冲	自动缓冲
API 友好度	较低，需手动处理更多细节	较高，封装更完善
核心功能覆盖	支持文件 / 目录 / 网络 I/O	仅支持基础文件 I/O
底层关系	独立的低级接口	基于 POSIX 实现，属于上层封装

三、系统调用核心知识

操作系统的核心角色
- 抽象提供者：屏蔽硬件复杂性，提供统一 API（文件系统：open ()/read () 等；网络栈：connect ()/listen () 等；虚拟内存：brk () 等；进程管理：fork () 等）。
- 保护系统 ：
  - 隔离性：进程间相互隔离，支持通过文件名等命名空间受控共享。
  - 特权分级：OS 运行在 CPU 特权模式，用户程序运行在非特权模式，禁止直接访问硬件。
x86/Linux 系统调用详细流程
1. 用户态准备：程序调用 glibc 函数（如 fopen ()），glibc 将系统调用号、参数存入寄存器。
2. 触发特权切换：glibc 调用 linux-gate.so（内核提供的 vdso）中的__kernel_vsyscall 函数，最终执行 SYSENTER 指令。
3. 进入内核态：CPU 切换为特权模式，修改 SP（栈指针）、IP（指令指针），跳转到内核预设入口。
4. 内核处理：内核通过系统调用号查询调度表，执行对应处理函数（如 open () 对应 sys_open，系统调用号 5），可能涉及硬件交互（如磁盘读写），期间可能发生进程上下文切换。
5. 返回用户态：处理完成后，内核将返回值存入寄存器，执行 SYSEXIT 指令，恢复 SP/IP 和非特权模式，回到 glibc 函数。
6. 程序继续执行：glibc 处理返回结果后，将控制权交还给用户程序。
系统调用的三种调用方式（x86/Linux）
- 方式 1：程序调用 glibc 函数，完全在用户态处理（如 strcmp ()），不涉及内核。
- 方式 2：程序调用 glibc 函数，glibc 间接调用系统调用（如 fopen () 调用 open ()）。
- 方式 3：程序直接调用系统调用，无需依赖 glibc，但牺牲可移植性。
实用工具与参考资源
- strace ：跟踪进程的系统调用序列，示例：strace ls 2>&1 | less。
- 调试 / 检测工具：gdb（调试段错误）、valgrind（内存问题检测）、linter（代码规范检查）。
- 参考资料：1. 书籍《The Linux Programming Interface》；2. man 手册（man 2 = 系统调用，man 3 = 库函数）；3. CMU 快捷键表（http://www.cs.cmu.edu/~guna/15-123S11/Lectures/Lecture24.pdf）；4. 教材 CSPP §8.1--8.3。

4. 关键问题

问题 1：POSIX 的 read () 函数与 C 标准库的 fread () 相比，核心差异是什么？在实际使用中需要特别注意什么？

答案：核心差异是缓冲机制 和返回值处理：

read () 无缓冲，直接与内核交互；fread () 有缓冲，基于 read () 实现，效率更高但延迟可能更大；
read () 可能返回少于请求字节数（如硬件限制、信号中断），需循环读取；

fread () 返回成功读取的完整数据块数，内部已处理部分读取场景。

实际使用需注意：read () 需处理 EINTR 错误（调用被中断时重试），且需手动管理缓冲区偏移；fread () 无需关注底层细节，但不支持目录操作和网络 I/O。

问题 2：x86/Linux 系统中，用户程序触发系统调用后，CPU 的特权模式和执行流程如何变化？

答案：流程与特权模式变化如下：

初始状态：用户程序运行在非特权模式，执行用户态代码；
触发调用：程序调用 glibc 函数，通过 linux-gate.so 将系统调用号 / 参数存入寄存器，执行 SYSENTER 指令；
特权切换：CPU 切换为特权模式，跳转到内核态的系统调用入口；
内核处理：内核查找系统调用表，执行对应 handler（如 open () 对应 sys_open），期间可能与硬件交互或切换进程；
返回用户态：处理完成后，通过 SYSEXIT 指令恢复非特权模式，将返回值存入寄存器，回到 glibc 函数，最终返回用户程序。

问题 3：在使用 POSIX 的 open () 和 read () 函数时，文件描述符的作用是什么？如何正确处理 read () 函数的返回值以确保读取到预期的字节数？

答案：

文件描述符的作用：是内核分配给打开文件的整数标识符（默认 0=stdin、1=stdout、2=stderr），用于后续 read ()、write () 等操作标识目标文件，替代 C 标准库的 FILE * 抽象。
正确处理 read () 返回值的逻辑：

① 初始化缓冲区（大小 n）、bytes_left（初始为 n）和 result（存储 read () 返回值）；

② 循环读取：result = read(fd, buf + (n - bytes_left), bytes_left)；

③ 处理返回值：- 若 result=-1，若 errno=EINTR 则重试，否则判定为错误；- 若 result=0 则表示 EOF，终止循环；- 若 result>0 则更新 bytes_left（bytes_left -= result）；

④ 循环直至 bytes_left=0，确保读取到预期字节数。