[操作系统] 基础 IO：理解“文件”与 C 接口

在 Linux 操作系统中，"一切皆文件"这一哲学思想贯穿始终。从基础 IO 学习角度来看，理解"文件"不仅仅意味着了解磁盘上存储的数据，还包括对内核如何管理各种资源的认识。本文将从狭义与广义两个层面对"文件"进行解读，归纳文件操作的分类，并从系统角度解析文件的底层实现；接着回顾 C 语言文件接口部分，通过 hello.c 案例展示文件的打开、写入与读取，同时探讨如何将信息输出到显示器、标准流的使用以及各种文件打开方式。

理解"文件"

1-1. 狭义理解

在狭义上，"文件"通常指存储在磁盘中的普通文件。它是由字节（或字符）序列构成的数据集合，在磁盘上以一定的结构保存（如 FAT、ext4 等文件系统）。使用狭义概念时，我们关注的是文件的内容、大小、权限等属性。例如，一个存放文本数据的文件或一个二进制文件，都可以被看作传统意义上的"文件"。文件对外设的输入输出简称IO。

示例代码（仅演示概念，不涉及实际操作）：

c 复制代码

// 假设 f1.txt 是一个普通文本文件
FILE *fp = fopen("f1.txt", "r");  // 以只读方式打开文件
if (fp == NULL) {
    perror("打开文件失败");
    exit(EXIT_FAILURE);
}
// 读取或处理文件...
fclose(fp);

1-2. 广义理解

广义上，Linux 中的"文件"概念远不止传统的磁盘文件。Linux 哲学中**"一切皆文件"**意味着：

设备文件：包括字符设备、块设备，代表硬件（如键盘、显示器、硬盘）；
管道和套接字：用于进程间通信；
目录：虽然目录本质上是特殊类型的文件，但它们存储的是文件名和相关元数据；
虚拟文件 ：例如 /proc 下的各种伪文件，用于显示内核和进程状态。

这种广义的理解使得操作系统将各种资源统一为文件接口，程序员在操作时无需关心底层硬件的细节，只需通过统一的读写操作即可。

1-3. 文件操作的归类认知

文件是文件属性（元数据）和文件内容的集合，文件 = 属性 + 内容。

所以所有的文件操作都是对文件内容或者对文件属性操作。

文件操作大体可以分为以下几类：

顺序读写：文件数据按顺序读取和写入。
随机访问：通过定位（如 lseek）在文件中跳转到任意位置进行读写。
标准流操作：通过 C 标准库的 fopen、fread、fwrite、fseek、fclose 等接口操作文件，这是一种缓冲 IO 方式，适用于大多数应用程序。
系统调用接口：使用 open、read、write、lseek、close 等系统调用，直接与内核交互，具有更低的开销和更高的灵活性，但使用较为复杂。

通过这样的分类，我们可以根据实际需求选择合适的接口。

1-4. 系统角度

对文件的操作本质上是进程对文件的操作。
磁盘管理者是操作系统，操作系统对打开的文件管理的方式是：先描述，后组织。
文件读写的本质不是通过各种语言的库函数来操作完成的，上层语言知识为了给用户提供方便，而是通过文件相关的系统调用来实现的。

回顾 C 文件接口

2-1. hello.c 打开文件

在 C 语言中，使用 fopen() 打开文件。函数原型如下：

c 复制代码

FILE *fopen(const char *filename, const char *mode);

其中，filename 表示文件名（可包含路径），mode 指定打开模式（如 "r"、"w"、"a" 等）。

示例代码：

c 复制代码

// hello.c ------ 打开文件示例
#include <stdio.h>
#include <stdlib.h>

int main(void) {
    FILE *fp = fopen("hello.txt", "w+"); // 以读写方式打开，如果文件不存在则创建，存在则清空
    if (fp == NULL) {
        perror("打开文件失败");
        exit(EXIT_FAILURE);
    }
    printf("文件打开成功，文件指针：%p\n", fp);
    fclose(fp);
    return 0;
}

2-2. hello.c 写文件

写文件操作可以使用 fwrite()、fputs()、fprintf()、fputc() 等接口。这里以 fputs() 为例：

c 复制代码

fputs("Hello, Linux IO!\n", fp);

或者使用 fprintf() 进行格式化输出：

c 复制代码

fprintf(fp, "数字：%d，字符串：%s\n", 123, "abc");

示例代码：

c 复制代码

// hello.c ------ 写文件示例
#include <stdio.h>
#include <stdlib.h>

int main(void) {
    FILE *fp = fopen("hello.txt", "w+");
    if (fp == NULL) {
        perror("打开文件失败");
        exit(EXIT_FAILURE);
    }

    // 使用 fprintf 写入数据
    fprintf(fp, "Hello, Linux IO!\n");
    // 使用 fputs 写入字符串
    fputs("这是通过 fputs 写入的一行文字。\n", fp);

    fclose(fp);
    return 0;
}

新文件的创建路径

<font style="color:rgb(31,35,41);">ls /proc/[进程id] -l</font>可以查看当前运行进程的信息。

bash 复制代码

[@VM-8-12-centos io]$ ps ajx | grep myProc
506729 533463 533463 506729 pts/249 533463 R+ 1002 7:45 ./myProc
536281 536542 536541 536281 pts/250 536541 R+ 1002 0:00 grep --
color=auto myProc
[@VM-8-12-centos io]$ ls /proc/533463 -l
total 0
......
-r--r--r-- 1  0 Aug 26 17:01 cpuset
lrwxrwxrwx 1  0 Aug 26 16:53 cwd -> /home/ddd/io
-r-------- 1  0 Aug 26 17:01 environ
lrwxrwxrwx 1  0 Aug 26 16:53 exe -> /home/ddd/io/myProc
dr-x------ 2  0 Aug 26 16:54 fd

其中：

**cwd：**指向当前进程运⾏⽬录的⼀个符号链接，当前进程中创建文件的默认相对路径。

**exe：**指向启动当前进程的可执⾏⽂件（完整路径）的符号链接。

每个进程在运行时都有一个当前工作目录（CWD），这是进程在文件系统中的"当前位置"。当进程打开一个文件时，如果文件路径是相对路径（即不以 / 开头），操作系统会默认将这个路径解析为相对于进程的当前工作目录。

2-3. hello.c 读文件

读文件操作常用的接口包括 fread()、fgets()、fgetc()。例如，使用 fgets() 逐行读取文件：

c 复制代码

char buffer[256];
while (fgets(buffer, sizeof(buffer), fp) != NULL) {
    printf("%s", buffer);
}

示例代码：

c 复制代码

// hello.c ------ 读文件示例
#include <stdio.h>
#include <stdlib.h>

int main(void) {
    FILE *fp = fopen("hello.txt", "r");
    if (fp == NULL) {
        perror("打开文件失败");
        exit(EXIT_FAILURE);
    }

    char buffer[256];
    while (fgets(buffer, sizeof(buffer), fp) != NULL) {
        printf("%s", buffer);
    }

    fclose(fp);
    return 0;
}

稍加改动即可模拟cat命令。

bash 复制代码

#include <stdio.h>
#include <string.h>

int main(int argc, char* argv[]) {
    // 检查命令行参数数量是否正确
    if (argc != 2) {
        printf("argv error!\n");
        return 1;
    }

    // 打开文件
    FILE *fp = fopen(argv[1], "r");
    if (!fp) {
        printf("fopen error!\n");
        return 2;
    }

    // 定义缓冲区
    char buf[1024];

    // 循环读取文件内容
    while (1) {
        int s = fread(buf, 1, sizeof(buf), fp);
        if (s > 0) {
            // 确保字符串以空字符结尾
            buf[s] = '\0';
            printf("%s", buf);
        }
        if (feof(fp)) {
            break;
        }
    }

    // 关闭文件
    fclose(fp);
    return 0;
}

2-4. 输出信息到显示器，你有哪些方法

在 C 语言中，将信息输出到显示器有多种方式：

printf()：最常用，直接向标准输出（stdout）输出格式化字符串。
puts()：输出字符串，并自动追加换行符。
fprintf(stdout, ...)：与 printf() 类似，但明确指定输出到 stdout。
fputs()：输出字符串，但不自动追加换行符。
putchar() /fputc()：逐字符输出。

每种方法各有优势，选择时可根据需求决定是否需要格式化、是否自动换行等。

2-5. stdin & stdout & stderr

在 C 语言中，标准流定义在 <stdio.h> 中：

stdin：标准输入流（默认绑定键盘）。
stdout：标准输出流（默认绑定显示器）。
stderr：标准错误流（默认绑定显示器，用于输出错误信息）。

这些流也是文件，在程序启动时添加打开这些流的代码，自动打开，所以在程序中可以直接使用这三个流，不需要调用 fopen()。

可以发现这三个标准流和fopen的返回值都是FILE，文件指针。后续会进行讲解。

2-6. 打开文件的方式

C 语言中使用 fopen() 打开文件时，可选模式包括：

"r"：只读模式，文件必须存在。
"w"：只写模式，文件存在则清空，不存在则创建。
"a"：追加模式，写入时追加到文件末尾，文件不存在则创建。
"r+"：读写模式，文件必须存在，不会清空原文件内容，写入操作从文件开始覆盖。
"w+"：读写模式，文件存在则清空，不存在则创建。
"a+"：读写模式，写入操作始终追加到文件末尾，但可读取整个文件内容。

对于二进制文件，需在模式字符串中添加字母 "b"（如 "rb", "wb", "ab+" 等）。

总结

本文从狭义与广义两方面深入探讨了 Linux 中的"文件"概念，阐释了文件操作的分类及系统底层实现------包括文件描述符、inode、缓冲机制等。随后，通过 hello.c 案例详细回顾了 C 语言文件接口的使用方法，从文件的打开、写入、读取，到如何利用各种标准流（stdin、stdout、stderr）输出信息，以及不同的文件打开模式。希望本文能为大家在 Linux 基础 IO 学习及 C 语言文件操作实践中提供清晰的指导和帮助。