©作者:末央&
©系列:C语言初阶(适合小白入门)
©说明:以凡人之笔墨,书写未来之大梦
目录
什么是文件
什么是文件?
文件是计算机文件,属于文件的一种,与普通文件的载体不同,计算机文件是以计算机硬盘为载体存储在计算机上的信息集合。
在程序设计中,我们一般关注的文件有两类,即程序文件和数据文件。
程序文件: 包括源程序(以.c为后缀)和可执行程序(以.exe为后缀)。
数据文件: 文件的内容不一定是程序,而是程序运行时读写的数据。比如程序运行时需要从中读取数据的文件,或者输出内容的文件。
注:这里本篇内容讨论的是数据文件。
文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件标识主要包含三部分:文件路径+文件名主干+文件后缀。
例如:
在这里插入图片描述
但是为了方便起见,文件标识常被称为文件名。
文件类型
根据数据的组织形式,数据文件被称为二进制文件或文本文件。
二进制文件: 数据在内存中以二进制的形式进行存储,如果不加转换直接输出到外存,就是二进制文件。
文本文件: 如果要求在外存上以ASCII码的形式存储,则需要在存储前进行转换。以ASCII码的形式进行存储的文件就是文本文件。
那么一个数据在外存中是如何存储的呢?
字符一律以ASCII码值进行存储;数值型数据既可以以ASCII码值进行存储,也可以以二进制的形式进行存储。
例如,有整数10000,如果我们以ASCII值的形式输出到磁盘,那么它将在磁盘中占用5个字节(一个字符一个字节);而如果以二进制的形式进行输出,那么它只在磁盘中占用4个字节(一个整型大小即可存储):
文件缓冲区
文件缓冲区是用以暂时存放读写期间的文件数据而在内存区预留的一定空间。使用文件缓冲区可减少读取硬盘的次数。
文件缓冲系统: 是指系统自动地在内存中为程序中每一个正在使用的文件开辟开辟一块"文件缓冲区"。从内存向磁盘输出的数据会先送到内存中的缓冲区,待缓冲区装满后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区,待缓冲区装满后,再从缓冲区逐个地将数据送到程序数据区。缓冲区的大小是根据C编译系统决定。
为什么存在缓冲区?
相信有很多人心里还不理解为什么存在缓冲区。举个比较形象的例子,当你的老师在忙于备考时,你有一点小问题就去请教老师,有一点小问题又去请教老师,这种情况下老师的备考效率会大大降低,那么你为什么不将你的小问题累计起来,当累计到一定量时再一次性去请教老师,这样老师的备考效率也会相对提高。
例子中的"老师"就好比操作系统,"小问题"就好比需要操作系统传输的信息,而"你积累问题到一定量再去请教老师"就好比缓冲区的工作机制。
总而言之,缓冲区的存在大大提高了操作系统的效率。
文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字、文件的状态及文件的当前位置等)。这些信息是保存在一个结构体变量中的,该结构体变量是由系统声明的,并将该结构体类型重命名为FILE。
例如,在VS2013编译器环境提供的stdio.h头文件中有以下的文件类型声明:
c
struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是都大同小异。
每当我们打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息。
我们可以创建一个FILE*的指针变量:
c
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型的指针变量,可以使pf指向某个文件的文件信息区,通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量就能找到与它关联的文件。
文件操作函数
前言
我们已经了解了文件的基本概念,那么我们如何通过代码对某一个文件进行一些操作呢?比如如何打开文件、关闭文件以及如何向文件中写入或是读取数据呢?
在头文件stdio.h中包含了一系列的文件操作函数,以便我们对特定的文件进行相应的操作。学会对文件进行操作后,我们就可以将代码与文件联系起来,这样能让编程变得更有意思不是吗?比如你可以用代码写一个游戏,当游戏结束后可以将游戏当前的数据保存到一个文件中,那么当你下一次运行代码时只要先读取该文件中的数据,就可以接着上一次的游戏进度继续玩,而不至于从头再来。
下面介绍了打开以及关闭文件的操作函数,以及其中的一些细节。
文件打开函数 - fopen
c
FILE *fopen( const char *filename, const char *mode );
该函数的功能就是打开一个文件,函数的第一个参数是你要打开的文件的文件名,第二个参数是打开这个文件的形式。
我们知道打开一个文件时,系统会为该文件创建一个文件信息区,该函数调用完毕后,如果打开该文件成功,那么返回指向该文件信息区的指针(FILE*类型);如果打开文件失败,那么返回一个空指针(NULL)。
下面介绍他的打开方式:
举个几个例子:
1.若我们要以文本形式打开一个名叫data.txt的文件,将要对其进行输入操作,那么打开文件时应该这样写:
c
FILE* pf = fopen("data.txt", "r");
注:data.txt文件必须存在,不然打开文件失败,fopen函数会返回一个空指针。
2.若我们要以二进制打开一个名叫data.bin的文件,将要对其进行输出操作,那么打开文件时应该这样写:
c
FILE* pf = fopen("data.bin", "wb");
注:data.bin文件若存在,将销毁文件原有内容,再对其进行输出;data.bin文件若不存在,系统将主动创建一个名叫data.bin的文件
相对路径与绝对路径
填写fopen函数的第一个参数的时候,如果我们要打开的文件与我们正在运行的源代码在同级目录下(以打开data.txt文件为例),那么我们应该这样写:
c
FILE* pf = fopen("data.txt", "r");//同级
但是如果我们想要打开的文件与当前运行的源代码不在同一级目录下呢?
这时我们的写法有两种,相对路径和绝对路径。
一、相对路径
当待打开的文件位于正在运行的源代码的上一级时:
c
FILE* pf = fopen("../data.txt", "r");//上一级
当待打开的文件位于正在运行的源代码的上上级时:
c
FILE* pf = fopen("../../data.txt", "r");//上上级
当待打开的文件位于正在运行的源代码的下一级时:
c
FILE* pf = fopen("Debug/data.txt", "r");//下一级
注:这里data.txt文件在Debug文件内,Debug文件与正在运行的源代码在同级目录下。
总结:
要打开上级的文件在原来的基础上加上". ./",再上一级再加一个". ./",以此类推。
要打开下级的文件,就需从源代码这一级开始,写出目标文件的路径。
二、绝对路径
有博友可能觉得相对路径的方法比较麻烦(可能还要去数目标文件与源文件相差的级数),绝对路径就没那么麻烦了,绝对路径就直接写出目标文件的完整路径即可,例如:
c
FILE* pf = fopen("D:\\code\\File_function\\File_function\\data.txt", "r");
注:文件的路径原本为"D:\code\File_function\File_function\data.txt",但是为了防止字符串中的'\'及其后面的字符被整体视为为转义字符,所以需要在每个'\'后面再加一个'\'。
文件关闭函数 - fclose
与动态开辟内存空间时一样,当我们打开文件时,会在内存中开辟一块空间,如果我们打开该文件后不关闭,那么这个空间会一直存在,一直占用那块内存空间,所以当我们对一个文件的操作结束时,一定要记住将该文件关闭。这就需要用到fclose函数来关闭文件。
c
int fclose( FILE *stream );
我们如果要关闭一个文件,那么直接将该文件的文件指针传入fclose函数即可,fclose函数如果关闭文件成功会返回0。与free函数一样,当我们调用完fclose函数将文件关闭后,我们也要将指向文件信息区的指针置空,避免该指针变成野指针
c
fclose(pf);//关闭pf指向的文件
pf = NULL;//及时置空
文件操作正确流程
知道了如何打开文件和关闭文件,也就相当于知道了如何进入和如何出去,所以当我们要对一个文件进行操作的时候,正确的流程应该是这样的:
c
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
//打开文件
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)//检测指针有效性
{
printf("%s\n", strerror(errno));//错误提醒
return 1;//失败返回
}
//对文件进行一系列操作
//...
//关闭文件
fclose(pf);关闭pf指向的文件
pf = NULL;//及时置空
return 0;
}