文件基础和文件fd

文章目录

正文开始前给大家推荐个网站,前些天发现了一个巨牛的 人工智能 学习网站, 通俗易懂,风趣幽默 ,忍不住分享一下给大家。 点击跳转到网站

预备知识

我们平时说文件就是说文件里面有什么,那么空文件有大小吗?答案肯定是有的,我们平时所说的文件除了文件的内容以外还存在文件的创建时间,大小等等,这是文件的属性,所以文件 = 内容 + 属性的。所以我们对文件的操作无非就是对文件内容或者对文件属性的操作。不管是内容还是属性,它们本质都是数据,所以他们被存储在磁盘中,就是磁盘文件。所以我们要访问一个文件的时候都是要把这个文件打开的,该文件被打开前就是磁盘文件,被打开后,因为CPU只和内存打交道,所以被打开的文件一定会被加载到内存。所以加载磁盘文件,一定会访问外设,这部分工作是由OS来做的。

一个进程是可以打开很多文件的,所以进程和文件的比例关系一定是 1 :n 。而在我们的系统中是有很多进程的,所以被打开的文件也可能会非常的多,所以OS要对这些文件进行管理,管理的本质就是先描述在组织,因此在OS中存在struct file结构体来描述文件,所以以后打开一个文件就创建一个file结构体,把他们用链表链起来,对文件的管理就成了对该链表的增删查改。

C语言的文件接口

C语言打开文件的是fopen

第一个参数就是打开文件的名称,可以使用绝对路径也可以使用相对路径,第二个参数是打开的模式,经常用的就是w以写的方式打开,但是每次打开都会清空文件,不存在就创建,还有一种常用的是a以追加的方式打开,每次打开不会清空文件,直接在文件结尾进行写入,依然是不存在就创建。还有r方式,是以只读的方式打开。经常用的就是这三种模式。

我们会发现w模式和我们指令所讲的输出重定向非常像。

a模式和追加重定向非常相似。

系统调用

我们再来认识一个系统调用open。

open函数是一个系统用调用,它的第一个参数就是文件名,和fopen一样,但是第二个参数是标志位。标志位有很多但是这里我们只介绍常用的几种。第三个参数是文件的权限,一般来说只有创建文件的时候需要设置。

关于函数传入标志为的技巧是Linux中常用的传参方式,接下来给兄弟们演示一下什么叫做标志位传参。

c 复制代码
#include <stdio.h>

#define Print1 1
#define Print2 (1 << 1)
#define Print3 (1 << 2)
#define Print4 (1 << 3)

void printflag (int flag)
{
    if(flag & Print1) printf("i am Print1\n");
    if(flag & Print2) printf("i am Print2\n");
    if(flag & Print3) printf("i am Print3\n");
    if(flag & Print4) printf("i am Print4\n");
}
int main()
{
    printflag(Print1);
    printf("============================\n");
    printflag(Print1 | Print2);
    printf("============================\n");
    printflag(Print1 | Print2 | Print3);
    printf("============================\n");
    printflag(Print1 | Print2 | Print3 | Print4);
    printf("============================\n");
    return 0;
}

所以open的第二个参数第原理和这个基本上是差不多的,它的选项常用的O_WRONLY(只写)、O_RDONLY(只读)、O_CREAT(不存在就创建)、O_TRUNC(每次打开时清空文件)、O_APPEND(追加写,不清空文件)。open的返回值是一个fd(文件描述符),它是用来表示一个文件的。所以C语言中的FILE也一定封装了这个数字。有了这些选项的基础,我们可以来模仿实现一下fopen的各个选项的实现。

c 复制代码
FILE _fopen(const char * str, char c)
{
    int flag = 0;
    int is_read;
    if(c == 'a')
    {
        flag = O_WRONLY | O_APPEND | O_CREAT;
    }
    else
    {
        if(c == 'w')
        {
        flag = O_WRONLY | O_TRUNC | O_CREAT;

        }
        else
        {
            if(c == 'r')
            {
                flag = O_RDONLY;
                is_read = 1;
            }
            else
            {
                //TODO
            }
        }
    }

    int fd = 0;
    if(is_read)
    {
        fd = open(str, flag, 0x666);
        if(fd < 0)
        {
            perror("open");
            exit(-1);
        } 
    }
    else
    {
        fd = open(str, flag);
        if(fd < 0)
        {
            perror("open");
            exit(-1);
        } 
    }
    FILE file;
    // _fileno就是文件描述符
    file._fileno = fd;
    return file;
}

所以C语言的所有库函数的本质都是封装了系统调用。

文件fd

到这里我们可以来尝试理解一下文件了。如何在系统层面上理解一下文件呢?

我们知道每个进程在被创建是都是会有自己的PCB的,在Linux中也就是task_struct,所以每个进程的PCB中都有一个struct files_struct* files 的指针,这个指针指向的结构体中有一个非常重要的一张表,struct file* fd_array[],这是一个指针数组,我们打开的每一个文件都会被在这个指针数组中被指向,一般来说是从小到大来排列的,而数组的下标就是我们上面系统调用返回的文件描述符。所以文件描述符的本质就是数组的下标。操作系统访问文件只认识文件描述符。

我们进程在运行的时候,是会默认打开三个流,标准输入流、标准输出流、标准错误流。这三个流对应的硬件分别是键盘、显示器、显示器。因为Linux下一切皆文件,所以这三个流在进程被打开时会一次把文件描述符表的0、1、2位置给占了,所以我们自己打开的文件的fd一般是从3开始从小到大排的。

OS默认打开三个流,就是为了我们程序员默认进行输入输出的代码的编写。

我们如何理解一切接文件?

在file文件中是有函数指针的,所以对于不同的文件我们让它的文件指针指向对应的方法,如果没有改方法的话我们让这个指针指向空就行了,所以在上层看来,文件就是这个方法,但是它是可能对于不同的文件指向的方法也是不同的。

相关推荐
Creeper_exe16 分钟前
RHCE http作业
linux·http
Johny_Zhao1 小时前
Centos7系统docker部署Ferry工单系统
linux·工单系统·ferry
ITenderL2 小时前
Linux常用命令总结
linux·常用命令
Ljw...2 小时前
进程信号
linux·进程信号
昨天今天明天好多天2 小时前
【Linux】Kafka部署
linux·运维·kafka
梅秃头2 小时前
CentOS 8修改Linux配置文件指定属性的值
linux·运维·服务器
一个小坑货2 小时前
CentOS9 Stream上安装Edge浏览器
linux·centos
我是如子啊2 小时前
【UBuntu20 配置usb网卡】 记录Ubuntu20配置usb网卡(特别是建立热点)
linux·网卡·教程·ubuntu20.04·wifi热点·ap·usb网卡
sdau_blue2 小时前
pycharm远程服务器Linux下解决cannot connect to X server问题
linux·运维·服务器
CP-DD2 小时前
linux 高级 I/O
linux