C++的IO流(文件部分)

1. C语言的输入与输出

C语言中我们用到的最频繁的输入输出方式就是scanf ()与printf()。 scanf(): 从标准输入设备(键盘)读取数据,并将值存放在变量中。printf(): 将指定的文字/字符串输出到标准输出设备(屏幕)。 注意宽度输出和精度输出控制。C语言借助了相应的缓冲区来进行输入与输出。如下图所示:

对输入输出缓冲区的理解:

1.可以屏蔽掉低级I/O的实现,低级I/O的实现依赖操作系统本身内核的实现,所以如果能够屏 蔽这部分的差异,可以很容易写出可移植的程序。

2.可以使用这部分的内容实现"行"读取的行为,对于计算机而言是没有"行"这个概念,有了这 部分,就可以定义"行"的概念,然后解析缓冲区的内容,返回一个"行"。

2. 流是什么

"流"即是流动的意思,是物质从一处向另一处流动的过程,是对一种有序连续且具有方向性的数 据( 其单位可以是bit,byte,packet )的抽象描述。

C++流是指信息从外部输入设备(如键盘)向计算机内部(如内存)输入和从内存向外部输出设 备(显示器)输出的过程。这种输入输出的过程被形象的比喻为"流"。 它的特性是:有序连续、具有方向性

为了实现这种流动,C++定义了I/O标准类库,这些每个类都称为流/流类,用以完成某方面的功能

3. C++IO流

C++系统实现了一个庞大的类库,其中ios为基类,其他类都是直接或间接派生自ios类

|-----------|----------------|----------|---------------|
| istream | | ifstream | istringstream |
| iostream | cin | fstream | stringstream |
| ostream | cout,cerr,clog | ofstream | ostringstream |
| streambuf | | filebuf | stringbuf |

3.1 C++标准IO流

C++标准库提供了4个全局流对象cin、cout、cerr、clog,使用cout进行标准输出,即数据从内 存流向控制台(显示器)。使用cin进行标准输入即数据通过键盘输入到程序中,同时C++标准库还 提供了cerr用来进行标准错误的输出,以及clog进行日志的输出,从上图可以看出,cout、

cerr、clog是ostream类的三个不同的对象,因此这三个对象现在基本没有区别,只是应用场景不 同。

在使用时候必须要包含文件并引入std标准命名空间。

注意:

  1. cin为缓冲流。键盘输入的数据保存在缓冲区中,当要提取时,是从缓冲区中拿。如果一次输 入过多,会留在那儿慢慢用,如果输入错了,必须在回车之前修改,如果回车键按下就无法 挽回了。只有把输入缓冲区中的数据取完后,才要求输入新的数据。

  2. 输入的数据类型必须与要提取的数据类型一致,否则出错。出错只是在流的状态字state中对 应位置位(置1),程序继续。

  3. 空格和回车都可以作为数据之间的分格符,所以多个数据可以在一行输入,也可以分行输 入。但如果是字符型和字符串,则空格(ASCII码为32)无法用cin输入,字符串中也不能有 空格。回车符也无法读入。

  4. cin和cout可以直接输入和输出内置类型数据,原因:标准库已经将所有内置类型的输入和 输出全部重载了:

  1. 对于自定义类型,如果要支持cin和cout的标准输入输出,需要对和>>进行重载。

  2. 在线OJ中的输入和输出:

对于IO类型的算法,一般都需要循环输入:

输出:严格按照题目的要求进行,多一个少一个空格都不行。

连续输入时,vs系列编译器下在输入ctrl+Z时结束

cpp 复制代码
// 单个元素循环输入

while(cin>>a)
{
    // ...

}

// 多个元素循环输入

while(c>>a>>b>>c)
{
    // ...

}

// 整行接收

while(cin>>str)
{
    // ...

}
  1. istream类型对象转换为逻辑条件判断值
cpp 复制代码
istream& operator>> (int& val);

explicit operator bool() const;

实际上我们看到使用while(cin>>i)去流中提取对象数据时,调用的是operator>>,返回值是

istream类型的对象,那么这里可以做逻辑条件值,源自于istream的对象又调用了operator bool,operator bool调用时如果接收流失败,或者有结束标志,则返回false。

cpp 复制代码
class Date
{
	friend ostream& operator << (ostream& out, const Date& d);
	friend istream& operator >> (istream& in, Date& d);
public:
	Date(int year = 1, int month = 1, int day = 1)
		:_year(year)
		, _month(month)
		, _day(day)
	{}
	operator bool()
	{
		// 这里是随意写的,假设输入_year为0,则结束

		if (_year == 0)
			return false;
		else
			return true;
	}
private:
	int _year;
	int _month;
	int _day;
};

istream& operator >> (istream& in, Date& d)
{
	in >> d._year >> d._month >> d._day;
	return in;
}

ostream& operator << (ostream& out, const Date& d)
{
	out << d._year << " " << d._month << " " << d._day;
	return out;
}

// C++ IO流,使用面向对象+运算符重载的方式

// 能更好的兼容自定义类型,流插入和流提取

int main()
{
	// 自动识别类型的本质--函数重载

	// 内置类型可以直接使用--因为库里面ostream类型已经实现了

	int i = 1;
	double j = 2.2;
	cout << i << endl;
	cout << j << endl;
	// 自定义类型则需要我们自己重载<< 和 >>

	Date d(2022, 4, 10);
	cout << d;
	while (d)
	{
		cin >> d;
		cout << d;
	}
	return 0;
}

3.2 C++文件IO流

C++文件流的优势就是可以对内置类型和自定义类型,都使用一样的方式,去流插入和流提取数据

当然这里自定义类型Date需要重载 >> 和 <<

写入文件C++根据文件内容的数据格式分为二进制文件和文本文件。采用文件流对象操作文件的一般步 骤:

  1. 定义一个文件流对象

ifstream ifile(只输入用)

ofstream ofile(只输出用)

fstream iofile(既输入又输出用)

  1. 使用文件流对象的成员函数打开一个磁盘文件,使得文件流对象和磁盘文件之间建立联系

  2. 使用提取和插入运算符对文件进行读写操作,或使用成员函数进行读写

  3. 关闭文件

在自定义类型中重载string,这里涉及到文件的写入,string的str转c_str,弄成char类型才能插入

ofstream

切记二进制写入就要用二进制读

往文件中写入

二进制的方法写入文件

文本的方式写入文件

能这样写的原因是,用了重载的流插入,因为继承,ofstream可以传给ostream

ifstream

切记二进制写入就要用二进制读

从文件中写出

文件中是上一个ofstream写入文件中的数据

文本的方式从文件写入d1

二进制的方式从文件写入d1

read(从文件中读或者写入)

切记二进制写入就要用二进制读

记得转换类型char*

write(写入文件)

切记二进制写入就要用二进制读

记得类型转换const char*

模拟一下

加上空格,防止从文件读时出现问题,连续的二进制数字会变成别的

cpp 复制代码
class Date
{
	friend ostream& operator << (ostream& out, const Date& d);
	friend istream& operator >> (istream& in, Date& d);

public:
	Date(int year = 1, int month = 1, int day = 1)
		:_year(year)
		, _month(month)
		, _day(day)
	{}
	operator bool()
	{
		// 这里是随意写的,假设输入_year为0,则结束

		if (_year == 0)
			return false;
		else
			return true;
	}
private:
	int _year;
	int _month;
	int _day;
};
istream& operator >> (istream& in, Date& d)
{
	in >> d._year >> d._month >> d._day;
	return in;
}
ostream& operator << (ostream& out, const Date& d)
{
	out << d._year << " " << d._month << " " << d._day;
	return out;
}
struct ServerInfo
{
	char _address[32];
	int _port;
	Date _date;
};

struct ConfigManager
{
public:
	ConfigManager(const char* filename)
		:_filename(filename)
	{}
	void WriteBin(const ServerInfo& info)
	{
		ofstream ofs(_filename, ios_base::out | ios_base::binary);
		ofs.write((const char*)&info, sizeof(info));
	}
	void ReadBin(ServerInfo& info)
	{
		ifstream ifs(_filename, ios_base::in | ios_base::binary);
		ifs.read((char*)&info, sizeof(info));
	}
	void WriteText(const ServerInfo& info)
	{
		ofstream ofs(_filename);
		ofs << info._address << " " << info._port << " " << info._date;
	}
	void ReadText(ServerInfo& info)
	{
		ifstream ifs(_filename);
		ifs >> info._address >> info._port >> info._date;
	}

private:
	string _filename; // 配置文件
};

int main()
{
	ServerInfo winfo = { "192.0.0.1", 80, { 2022, 4, 10 } };

	// 二进制读写

	ConfigManager cf_bin("test.bin");
	cf_bin.WriteBin(winfo);
	ServerInfo rbinfo;
	cf_bin.ReadBin(rbinfo);
	cout << rbinfo._address << " " << rbinfo._port << " "

		<< rbinfo._date << endl;
	// 文本读写

	ConfigManager cf_text("test.text");
	cf_text.WriteText(winfo);
	ServerInfo rtinfo;
	cf_text.ReadText(rtinfo);
	cout << rtinfo._address << " " << rtinfo._port << " " <<

	rtinfo._date << endl;

	return 0;
}

get(从文件中拿数据)

get一次往后走一次再打印,有点像fgetc

C++出流是为了更好的搞定自定义类型

C语言中用sprintf可以整型转字符串

ostringstream

C++中可以用ostringstream,自定义类型转字符串

ostringstream是ostream的派生类

这里的oss<<d,去调用的是ostream&operator<<,本质上都会以字符串的形式进去out,然后再用str函数取出这个字符串,用string接收

istringstream

字符串转整形

stringstream

有(istringstream,ostringstream)的功能

都转成字符串

然后就可以随意提取了

为什么整形的存储要用补码,cpu只有加法器,负数存的是补码,补码的最大意义就是用加法就可以算减法

1. 为什么使用文件

我们前面学习结构体时,写了通讯录的程序,当通讯录运行起来的时候,可以给通讯录中增加、删除数据,此时数据是存放在内存中,当程序退出的时候,通讯录中的数据自然就不存在了,等下次运行通讯 录程序的时候,数据又得重新录入,如果使用这样的通讯录就很难受。 我们在想既然是通讯录就应该把信息记录下来,只有我们自己选择删除数据的时候,数据才不复存在。 这就涉及到了数据持久化的问题 ,我们一般数据持久化的方法有,把数据存放在磁盘文件、存放到数据 库等方式。 使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。

2. 什么是文件

磁盘上的文件是文件。 但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。

记住打开文件扩展名,要不然后缀会自己带上了

2.1 程序文件

包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

2.2 数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件, 或者输出内容的文件。

本章讨论的是数据文件。 在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理 的就是磁盘上文件。

3. 文件的打开和关闭

3.1 文件指针

缓冲文件系统中,关键的概念是"文件类型指针",简称"文件指针"。

每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统 声明的,取名FILE.

例如,VS2013编译环境提供的 stdio.h 头文件中有以下的文件类型申明:

cpp 复制代码
struct _iobuf {
        char *_ptr;
        int   _cnt;
        char *_base;
        int   _flag;
        int   _file;
        int   _charbuf;
        int   _bufsiz;
        char *_tmpfname;
       };

typedef struct _iobuf FILE;

不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。 每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息, 使用者不必关心细节。 一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。

下面我们可以创建一个FILE*的指针变量:

cpp 复制代码
FILE* pf;//文件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。

比如:

3.2 文件的打开和关闭

文件在读写之前应该先打开文件(有相对路径和绝对路径,Linux有) ,在使用结束之后应该关闭文件

在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。

ANSIC规定使用fopen函数来打开文件fclose来关闭文件。

举个例子

返回一个FILE类型的指针所以要拿FILE类型的指针接收

cpp 复制代码
//打开文件

FILE * fopen ( const char * filename, const char * mode );

//关闭文件

int fclose ( FILE * stream );

打开方式如下:

4. 文件的顺序读写

读取文件的数据,大多是可以输出到屏幕上

scanf和printf是标准输入输出流

|---------|---------|-------|
| 功能 | 函数名 | 适用于 |
| 字符输入函数 | fgetc | 所有输入流 |
| 字符输出函数 | fputc | 所有输出流 |
| 本行行输入函数 | fgets | 所有输入流 |
| 文本行输出函数 | fputs | 所有输出流 |
| 格式化输入函数 | fscanf | 所有输入流 |
| 格式化输出函数 | fprintf | 所有输出流 |
| 二进制输入 | fread | 文件 |
| 二进制输出 | fwrite | 文件 |

fputc

往文件里写字符

首先打开文件时要用"w"类的

代码例子

把'a'改成'K'后,文件中的字母会被覆盖掉,'w'每次重新运行输入都会进行覆盖,把上一次的文件销毁掉,并且是顺序写入,一个一个顺序写

fgetc

这个是读取文件,已知文件就是fputc后的文件

也是顺序读取

fputs

是一行一行的写入文件(不换行就相当于顺序的字符串写入)(换行也能写入)

fgets

一次读取一行,如果没读取完继续顺序读取,否则没法进入下一行(\0也会读)

已知文件里内容就是fputs后的文件

从stream文件中读取num个字符并放入str中

fprintf

往文件里写数据和printf形似

fscanf

从文件里读数据和scanf形似

这里的是将文件中的数据写入s中

已知文件里的内容就是fprintf后的文件

fwrite

二进制写入文件,第一个参数是要写入文件的地址,第二个是参数的大小

是wb的方式写入

fread

已知文件里的内容就是fwrite后的文件

读取的方式是rb

返回值

sprintf和sscanf

将s的内容写入了buf

sscanf记得&&&&&&,这里是将buf里的内容写入tmp中

snprintf

4对比一组函数(printf,sacnf系列)

scanf/fscanf/sscanf printf/fprintf/sprintf

把通讯录改写成文件版本

5. 文件的随机读写

5.1 fseek

根据文件指针的位置和偏移量来定位文件指针。

int fseek ( FILE * stream, long int offset, int origin );

-2,相当于从d的位置往左两个,2就是往右两个

SEEK_CUR

SEEK_SET (和下标一样)

5.2 ftell

返回文件指针相对于起始位置的偏移量

long int ftell ( FILE * stream );

5.3 rewind

让文件指针的位置回到文件的起始位置

6. 文本文件和二进制文件

根据数据的组织形式,数据文件被称为文本文件或者二进制文件

数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件

如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。

一个数据在内存中是怎么存储的呢? 字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。 如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而 二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。

测试代码:

cpp 复制代码
#include <stdio.h>

int main()
{
 int a = 10000;
 FILE* pf = fopen("test.txt", "wb");
 fwrite(&a, 4, 1, pf);//二进制的形式写到文件中

 fclose(pf);
 pf = NULL;
 return 0;
}

7. 文件读取结束的判定

7.1 被错误使用的feof

牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。

而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。

  1. 文本文件读取是否结束,判断返回值是否为EOF ( fgetc ),或者 NULL ( fgets )

例如:

fgetc 判断是否为 EOF .

fgets 判断返回值是否为 NULL .

  1. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。

例如:

fread判断返回值是否小于实际要读的个数。

正确的使用:

cpp 复制代码
#include <stdio.h>
#include <stdlib.h>

 

int main(void)
{
    int c; // 注意:int,非char,要求处理EOF

    FILE* fp = fopen("test.txt", "r");
    if(!fp) {
        perror("File opening failed");
        return EXIT_FAILURE;
   }
 //fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF

    while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环

   { 
       putchar(c);
   }
    //判断是什么原因结束的

    if (ferror(fp))
        puts("I/O error when reading");
    else if (feof(fp))
        puts("End of file reached successfully");
 
    fclose(fp);
}

二进制文件的例子:

cpp 复制代码
#include <stdio.h>

 

enum { SIZE = 5 };

int main(void)
{
    double a[SIZE] = {1.,2.,3.,4.,5.};
    FILE *fp = fopen("test.bin", "wb"); // 必须用二进制模式

    fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组

    fclose(fp);
 
    double b[SIZE];
    fp = fopen("test.bin","rb");
    size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组

    if(ret_code == SIZE) {
        puts("Array read successfully, contents: ");
        for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
        putchar('\n');
   } else { // error handling

       if (feof(fp))
          printf("Error reading test.bin: unexpected end of file\n");
       else if (ferror(fp)) {
           perror("Error reading test.bin");
       }
   }
 
    fclose(fp);
}

8. 文件缓冲区

ANSIC 标准采用"缓冲文件系统"处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序 中每一个正在使用的文件开辟一块"文件缓冲区"。从内存向磁盘输出数据会先送到内存中的缓冲区,装 满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓 冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根 据C编译系统决定的。

测试缓冲区的存在

10秒之前文件中没有数据,10秒以后打开文件才有数据

这里可以得出一个结论: 因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文 件。 如果不做,可能导致读写文件的问题。

小总结

相关推荐
姚先生979 分钟前
LeetCode 35. 搜索插入位置 (C++实现)
c++·算法·leetcode
Theodore_102228 分钟前
3 需求分析
java·开发语言·算法·java-ee·软件工程·需求分析·需求
m0_7482522339 分钟前
前端关于pptxgen.js个人使用介绍
开发语言·前端·javascript
老大白菜1 小时前
FastAPI vs Go 性能对比分析
开发语言·golang·fastapi
No0d1es1 小时前
GESP CCF python二级编程等级考试认证真题 2024年12月
开发语言·python·青少年编程·gesp·ccf·二级
CoderCodingNo1 小时前
【GESP】C++二级考试大纲知识点梳理, (4)流程图
开发语言·c++·流程图
无奈ieq1 小时前
Scala快速入门+示例
开发语言·后端·scala
小小unicorn1 小时前
【C++初阶】STL详解(十三)—— 用一个哈希表同时封装出unordered_map和unordered_set
java·c++·散列表
慕羽★1 小时前
详细介绍如何使用rapidjson读取json文件
linux·c++·windows·json·file·param·rapidjson
Eiceblue2 小时前
Python拆分Excel - 将工作簿或工作表拆分为多个文件
开发语言·python·excel