linux之FILE和文件系统(磁盘的介绍)

1.FILE

(1)是什么

FILE就是c标准库用于储存文件属性和用户级缓冲区的地方，这个结构体空间在fopen这类c标准库中用于打开文件的函数内部创建(动态开辟)，也就是用c标准库打开的文件都有其自己的用户级缓冲区，往这些文件中写入数据时会先存进FILE内部指向的缓冲区中。

(2)意义

系统调用是有成本的:OS是很忙的，频繁调用系统会造成程序效率低下。因此先将用户级缓冲区存满再一次性的调用OS接口就可以提高c标准库函数的效率。

(3)用户级缓冲区刷新条件

(1)立即刷新->无缓冲->写透模式(WT)

(2)缓冲区满了->全缓冲(效率最高,常用于普通文件的写入)

(3)行刷新->行缓冲(如c库就是遇到了'\n'就刷新，常用于显示器的写入以方便用户读)

OS缓冲区的刷新条件由OS自主决定，用户无法得知(但有对应的接口)，因此可以认为将数据交给了OS就相当于给到了对应的硬件或文件了。

计算机内部的数据流动方式全部都是拷贝。

2.重定向与缓冲区

重定向还会更改缓冲区的刷新方式。例:原本向显示器写入的刷新条件为行刷新，重定向为向普通文件写入时刷新条件就改为全缓冲了，此时当缓冲区还没有满就开始子进程时，子进程会将父进程的用户级缓冲区中的数据也会拷贝一份，导致最后重定向文件中会有部分重复的数据。

例:

复制代码

#include <stdio.h>
#include <string.h>

int main()
{
    const char *msg0="hello printf\n";
    const char *msg1="hello fwrite\n";
    const char *msg2="hello write\n";
    printf("%s", msg0);
    fwrite(msg1, strlen(msg0), 1, stdout);
    write(1, msg2, strlen(msg2));
    //子进程中的缓冲区还会有着printf和fwrite中的数据
    //当进程结束后会把相同的数据也写入重定向的文件中
    fork();
    return 0;
}

c标准库管理FILE的方式也是先描述，再组织。

3.glibc的模拟实现

(1)glibc.h

cpp 复制代码

#pragma once
#define SIZE 1024
//刷新条件，WT，行刷新，全刷新
#define FLUSH_NONE 0
#define FLUSH_LINE 1
#define FLUSH_FULL 2

typedef struct IO_FILE
{
    //flag是刷新方式
    int flag; 
    //是fd
    int fileno; 
    //是用户级缓冲区
    char outbuffer[SIZE];
    //是outbuffer的最大的大小
    int cap;
    //是当前outbuffer的存储量
    int size;
}mFILE;

mFILE *mfopen(const char *filename, const char *mode);

int mfwrite(const void *ptr, int num, mFILE *stream);

void mfflush(mFILE *stream);

void mfclose(mFILE *stream);

(2)glibc.c

(补充)fsync

复制代码

int fsync(int fd);
//将fd对应的文件内核缓冲区数据直接刷新到硬件中

cpp 复制代码

#include "my_stdio.h"
#include <string.h>
#include <stdlib.h>
#include <sys/stat.h>
#include <sys/types.h>
#include <fcntl.h>
#include <unistd.h>
//open+初始化
mFILE *mfopen(const char *filename, const char *mode)
{
    int fd = -1;
    //根据mode运行对应的open模式
    if(strcmp(mode, "r") == 0)
    {
        fd = open(filename, O_RDONLY);
    }
    else if(strcmp(mode, "w")== 0)
    {
        fd = open(filename, O_CREAT|O_WRONLY|O_TRUNC, 0666);
    }
    else if(strcmp(mode, "a") == 0)
    {
        fd = open(filename, O_CREAT|O_WRONLY|O_APPEND, 0666);
    }
    if(fd < 0) return NULL;
    //初始化
    mFILE *mf = (mFILE*)malloc(sizeof(mFILE));
    mf->fileno = fd;
    //此处是默认向显示器写入，不同情况应该要用条件判断的
    mf->flag = FLUSH_LINE;
    mf->size = 0;
    mf->cap = SIZE;
    return mf;
}
void mfflush(mFILE *stream)
{
    if(stream->size > 0)
    {
        //写入的是写入到文件缓冲区中
        write(stream->fileno, stream->outbuffer, stream->size);
        //强制刷新
        fsync(stream->fileno);
        //size清零即可以初始化了
        stream->size = 0;
    }
}
    int mfwrite(const void *ptr, int num, mFILE *stream)
    {
        //从最后空的地方开始拷贝
        memcpy(stream->outbuffer+stream->size, ptr, num);
        stream->size += num;
        //检测此时的刷新条件并分析是否满足该条件
        if(stream->flag == FLUSH_LINE && stream->size > 0 && stream->outbuffer[stream->size-1]== '\n')
    {
        mfflush(stream);
    }
        return num;
    }
    //关闭文件前先刷新一下
    void mfclose(mFILE *stream)
    {
        if(stream->size > 0)
        {
            mfflush(stream);
        }
        close(stream->fileno);
    }