1. 缓冲区是什么
缓冲区就是一段内存空间。
2. 为什么要有缓冲区
IO写入有两种:
- 写透模式(WT) 成本高,效率低
- 写回模式(WB) 成本低,效率高
写透模式:每次的文件写入都要立即刷新到文件所在的磁盘上,一次不论写多少大小的内容。
写回模式:先把内容存下来,存到缓冲区中,等到到了一定条件,再统一刷新到磁盘上
因为磁盘是电脑上的一个外设,也是唯一的机械设备,对其的读写速度相当慢,而内存相比磁盘是相当快的,所以如果采用写透模式,就会拖慢计算机的整体效率
写回模式采取一定的刷新策略:1.立即刷新 2.行刷新(\n),3. 满刷新,
对应的特殊情况:1. 用户强制退出, 2. 进程退出
3. 缓冲区在哪里
那么缓冲区在哪里呢?
谁提供的函数接口,谁就要提供缓冲区的实现,缓冲区在哪里也就有根据了
比如c语言的fprintf(),就有对应的缓冲区,缓冲区由c标准库提供,他会在用户空间定义一块空间作为缓冲区。准确的说,就是在FILE结构体中
操作系统的接口write也有对应的缓冲区,在内核空间。
c语言层面的缓冲区,最后还是要给内核空间的缓冲区,c++缓冲区要给c语言的缓冲区,所以一般越底层的接口,速度越快。
cpp
// 测试IO接口
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdlib.h>
int main()
{
close(1);
int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
if (fd < 0)
{
perror("open");
return 1;
}
printf("print\n");
fprintf(stdout, "fprintf\n");
fputs("fputs\n", stdout);
write(fd, "write\n", sizeof "write\n");
perror("perror");
// fflush(stdout);
// close(fd);
fork();
}
没有fflush文件log.txt的内容
fflush后文件的内容
我们发现两次打印的内容不同,其中c语言的函数接口都打印了两次,而系统的打印接口只有一次
这是为什么呢?
fork创建子进程会在用户空间上刷新的时候会发生写时拷贝,缓冲区的内容也会拷贝一份,再刷新的时候就会有两份内容,而write属于内核级的内存空间,并没有影响。