[操作系统] 基础 IO:理解“文件”与 C 接口

在 Linux 操作系统中,"一切皆文件"这一哲学思想贯穿始终。从基础 IO 学习角度来看,理解"文件"不仅仅意味着了解磁盘上存储的数据,还包括对内核如何管理各种资源的认识。本文将从狭义与广义两个层面对"文件"进行解读,归纳文件操作的分类,并从系统角度解析文件的底层实现;接着回顾 C 语言文件接口部分,通过 hello.c 案例展示文件的打开、写入与读取,同时探讨如何将信息输出到显示器、标准流的使用以及各种文件打开方式。


理解"文件"

1-1. 狭义理解

在狭义上,"文件"通常指存储在磁盘中的普通文件。它是由字节(或字符)序列构成的数据集合,在磁盘上以一定的结构保存(如 FAT、ext4 等文件系统)。使用狭义概念时,我们关注的是文件的内容、大小、权限等属性。例如,一个存放文本数据的文件或一个二进制文件,都可以被看作传统意义上的"文件"。文件对外设的输入输出简称IO。

示例代码(仅演示概念,不涉及实际操作):

c 复制代码
// 假设 f1.txt 是一个普通文本文件
FILE *fp = fopen("f1.txt", "r");  // 以只读方式打开文件
if (fp == NULL) {
    perror("打开文件失败");
    exit(EXIT_FAILURE);
}
// 读取或处理文件...
fclose(fp);
1-2. 广义理解

广义上,Linux 中的"文件"概念远不止传统的磁盘文件。Linux 哲学中**"一切皆文件"**意味着:

  • 设备文件:包括字符设备、块设备,代表硬件(如键盘、显示器、硬盘);
  • 管道和套接字:用于进程间通信;
  • 目录:虽然目录本质上是特殊类型的文件,但它们存储的是文件名和相关元数据;
  • 虚拟文件 :例如 /proc 下的各种伪文件,用于显示内核和进程状态。

这种广义的理解使得操作系统将各种资源统一为文件接口,程序员在操作时无需关心底层硬件的细节,只需通过统一的读写操作即可。

1-3. 文件操作的归类认知

文件是文件属性(元数据)文件内容的集合,文件 = 属性 + 内容。

所以所有的文件操作都是对文件内容或者对文件属性操作。

文件操作大体可以分为以下几类:

  • 顺序读写:文件数据按顺序读取和写入。
  • 随机访问:通过定位(如 lseek)在文件中跳转到任意位置进行读写。
  • 标准流操作:通过 C 标准库的 fopen、fread、fwrite、fseek、fclose 等接口操作文件,这是一种缓冲 IO 方式,适用于大多数应用程序。
  • 系统调用接口:使用 open、read、write、lseek、close 等系统调用,直接与内核交互,具有更低的开销和更高的灵活性,但使用较为复杂。

通过这样的分类,我们可以根据实际需求选择合适的接口。

1-4. 系统角度
  1. 对文件的操作本质上是进程对文件的操作。
  2. 磁盘管理者是操作系统,操作系统对打开的文件管理的方式是:先描述,后组织
  3. 文件读写的本质不是通过各种语言的库函数来操作完成的,上层语言知识为了给用户提供方便,而是通过文件相关的系统调用来实现的。

回顾 C 文件接口

2-1. hello.c 打开文件

在 C 语言中,使用 fopen() 打开文件。函数原型如下:

c 复制代码
FILE *fopen(const char *filename, const char *mode);

其中,filename 表示文件名(可包含路径),mode 指定打开模式(如 "r"、"w"、"a" 等)。

示例代码:

c 复制代码
// hello.c ------ 打开文件示例
#include <stdio.h>
#include <stdlib.h>

int main(void) {
    FILE *fp = fopen("hello.txt", "w+"); // 以读写方式打开,如果文件不存在则创建,存在则清空
    if (fp == NULL) {
        perror("打开文件失败");
        exit(EXIT_FAILURE);
    }
    printf("文件打开成功,文件指针:%p\n", fp);
    fclose(fp);
    return 0;
}

2-2. hello.c 写文件

写文件操作可以使用 fwrite()fputs()fprintf()fputc() 等接口。这里以 fputs() 为例:

c 复制代码
fputs("Hello, Linux IO!\n", fp);

或者使用 fprintf() 进行格式化输出:

c 复制代码
fprintf(fp, "数字:%d,字符串:%s\n", 123, "abc");

示例代码:

c 复制代码
// hello.c ------ 写文件示例
#include <stdio.h>
#include <stdlib.h>

int main(void) {
    FILE *fp = fopen("hello.txt", "w+");
    if (fp == NULL) {
        perror("打开文件失败");
        exit(EXIT_FAILURE);
    }

    // 使用 fprintf 写入数据
    fprintf(fp, "Hello, Linux IO!\n");
    // 使用 fputs 写入字符串
    fputs("这是通过 fputs 写入的一行文字。\n", fp);

    fclose(fp);
    return 0;
}

新文件的创建路径

<font style="color:rgb(31,35,41);">ls /proc/[进程id] -l</font>可以查看当前运行进程的信息。

bash 复制代码
[@VM-8-12-centos io]$ ps ajx | grep myProc
506729 533463 533463 506729 pts/249 533463 R+ 1002 7:45 ./myProc
536281 536542 536541 536281 pts/250 536541 R+ 1002 0:00 grep --
color=auto myProc
[@VM-8-12-centos io]$ ls /proc/533463 -l
total 0
......
-r--r--r-- 1  0 Aug 26 17:01 cpuset
lrwxrwxrwx 1  0 Aug 26 16:53 cwd -> /home/ddd/io
-r-------- 1  0 Aug 26 17:01 environ
lrwxrwxrwx 1  0 Aug 26 16:53 exe -> /home/ddd/io/myProc
dr-x------ 2  0 Aug 26 16:54 fd

其中:

**cwd:**指向当前进程运⾏⽬录的⼀个符号链接,当前进程中创建文件的默认相对路径。

**exe:**指向启动当前进程的可执⾏⽂件(完整路径)的符号链接。

每个进程在运行时都有一个当前工作目录(CWD),这是进程在文件系统中的"当前位置"。当进程打开一个文件时,如果文件路径是相对路径(即不以 / 开头),操作系统会默认将这个路径解析为相对于进程的当前工作目录。

2-3. hello.c 读文件

读文件操作常用的接口包括 fread()fgets()fgetc()。例如,使用 fgets() 逐行读取文件:

c 复制代码
char buffer[256];
while (fgets(buffer, sizeof(buffer), fp) != NULL) {
    printf("%s", buffer);
}

示例代码:

c 复制代码
// hello.c ------ 读文件示例
#include <stdio.h>
#include <stdlib.h>

int main(void) {
    FILE *fp = fopen("hello.txt", "r");
    if (fp == NULL) {
        perror("打开文件失败");
        exit(EXIT_FAILURE);
    }

    char buffer[256];
    while (fgets(buffer, sizeof(buffer), fp) != NULL) {
        printf("%s", buffer);
    }

    fclose(fp);
    return 0;
}

稍加改动即可模拟cat命令。

bash 复制代码
#include <stdio.h>
#include <string.h>

int main(int argc, char* argv[]) {
    // 检查命令行参数数量是否正确
    if (argc != 2) {
        printf("argv error!\n");
        return 1;
    }

    // 打开文件
    FILE *fp = fopen(argv[1], "r");
    if (!fp) {
        printf("fopen error!\n");
        return 2;
    }

    // 定义缓冲区
    char buf[1024];

    // 循环读取文件内容
    while (1) {
        int s = fread(buf, 1, sizeof(buf), fp);
        if (s > 0) {
            // 确保字符串以空字符结尾
            buf[s] = '\0';
            printf("%s", buf);
        }
        if (feof(fp)) {
            break;
        }
    }

    // 关闭文件
    fclose(fp);
    return 0;
}

2-4. 输出信息到显示器,你有哪些方法

在 C 语言中,将信息输出到显示器有多种方式:

  • printf():最常用,直接向标准输出(stdout)输出格式化字符串。
  • puts():输出字符串,并自动追加换行符。
  • fprintf(stdout, ...):与 printf() 类似,但明确指定输出到 stdout。
  • fputs():输出字符串,但不自动追加换行符。
  • putchar() /fputc():逐字符输出。

每种方法各有优势,选择时可根据需求决定是否需要格式化、是否自动换行等。

2-5. stdin & stdout & stderr

在 C 语言中,标准流定义在 <stdio.h> 中:

  • stdin:标准输入流(默认绑定键盘)。
  • stdout:标准输出流(默认绑定显示器)。
  • stderr:标准错误流(默认绑定显示器,用于输出错误信息)。

这些流也是文件,在程序启动时添加打开这些流的代码,自动打开,所以在程序中可以直接使用这三个流,不需要调用 fopen()

可以发现这三个标准流和fopen的返回值都是FILE,文件指针。后续会进行讲解。

2-6. 打开文件的方式

C 语言中使用 fopen() 打开文件时,可选模式包括:

  • "r":只读模式,文件必须存在。
  • "w":只写模式,文件存在则清空,不存在则创建。
  • "a":追加模式,写入时追加到文件末尾,文件不存在则创建。
  • "r+":读写模式,文件必须存在,不会清空原文件内容,写入操作从文件开始覆盖。
  • "w+":读写模式,文件存在则清空,不存在则创建。
  • "a+":读写模式,写入操作始终追加到文件末尾,但可读取整个文件内容。

对于二进制文件,需在模式字符串中添加字母 "b"(如 "rb", "wb", "ab+" 等)。


总结

本文从狭义与广义两方面深入探讨了 Linux 中的"文件"概念,阐释了文件操作的分类及系统底层实现------包括文件描述符、inode、缓冲机制等。随后,通过 hello.c 案例详细回顾了 C 语言文件接口的使用方法,从文件的打开、写入、读取,到如何利用各种标准流(stdin、stdout、stderr)输出信息,以及不同的文件打开模式。希望本文能为大家在 Linux 基础 IO 学习及 C 语言文件操作实践中提供清晰的指导和帮助。

相关推荐
被程序耽误的胡先生几秒前
java中 kafka简单应用
java·开发语言·kafka
刀客1231 分钟前
python小项目编程-中级(1、图像处理)
开发语言·图像处理·python
卷卷的小趴菜学编程5 分钟前
c++之多态
c语言·开发语言·c++·面试·visual studio code
冷琴199625 分钟前
基于Python+Vue开发的反诈视频宣传管理系统源代码
开发语言·vue.js·python
跨境卫士小树33 分钟前
店铺矩阵崩塌前夜:跨境多账号运营的3个生死线
大数据·线性代数·矩阵
楠枬33 分钟前
网页五子棋——对战后端
java·开发语言·spring boot·websocket·spring
kyle~36 分钟前
thread---基本使用和常见错误
开发语言·c++·算法
坚持就完事了1 小时前
Python之numpy
开发语言·python·numpy
roman_日积跬步-终至千里1 小时前
【Flink 实战】Flink 中 Akka 通信与内存占用分析
大数据·flink
xlxxy_1 小时前
ABAP数据库表的增改查
开发语言·前端·数据库·sql·oracle·excel