文件缓冲区(IO与文件 ·III)(linux/C)

目录

缓冲区

为什么存在缓冲区

缓冲区刷新策略

FILE

文件缓冲区-》内核缓冲区

为什么要有语言级缓冲区(文件缓冲区)

举个缓冲区例子

补充

小知识


首先来深化下linux下一切皆文件

在linux中,windows里不是文件的东西,都被抽象成了文件。

这样做的好处是:开发者仅需使用一套API和开发工具,即可调取linux系统中绝大部分资源。

例:linux中几乎所有读(读文件)都使用read来进行,几乎所有改都使用write来进行

缓冲区

1.缓冲区本质是一段内存空间。


2.将数据交给缓冲区的本质都是拷贝,所以write、read等方法都是拷贝。

为什么存在缓冲区

意义在于提高了使用缓冲区的进程的效率

怎么提高效率:

1.允许数据在缓冲区中积压,一次就可以刷新多次数据,变相减少了IO次数。

2.允许进程单位时间内,做更多的工作,变相提高了使用缓存,使用者的效率。

缓冲区刷新策略

1.无缓冲,立即刷新

2.有缓冲,遇到换行符刷新(比如显示器文件使用)

3.有缓冲,写满再刷新(普通文件使用)
还有其他方式会引起缓冲区刷新:

1.进程强制刷新:fflush

2.进程结束自动刷新

FILE

是C语言库定义的一个结构体,因为IO相关函数与系统调用接口对应,并且库函数封装系统调用,所以本质上,访问文件都是通过fd访问的,所以FILE内部也必定封装了fd。

大致结构如下:

其中_fileno就是fd

FILE结构体内部为我们维护了一个语言级别的缓冲区空间,就是上图中一组组的char*指针区域。

文件缓冲区-》内核缓冲区

FILE内的缓冲区就是文件缓冲区。

1.用户的数据是先写到语言级别缓冲区FILE中,然后再到strcut file中包含指针指向的文件内核缓冲区。


2.对于用户来说,只要把数据从文件缓冲区刷新到操作系统的内核缓冲区,就算是写入完毕了,其余的工作由操作系统来做。

为什么要有语言级缓冲区(文件缓冲区)

1.调用系统调用是有成本的,比较废时间,所以需要减少系统调用次数,等需要刷新时再刷新到内核缓冲区。

2.提高使用语言IO接口的效率。

举个缓冲区例子

这段代码的直接运行结果是

而log.txt文件中:

这是为什么呢。

因为重定向后刷新策略变了,换行符不会刷新文件缓冲区了,所以数据就暂存到了log.txt的文件缓冲区,等到进程结束才会刷新到文件的内核缓冲区中,而write是直接刷新到内核缓冲区中的,所以如上。

补充

1.子进程fflush清空缓冲区,会进行写时拷贝,不会影响父进程。


2.操作系统中会有单独的执行流,会根据内存使用情况来动态刷新,尽管刷新条件不满足。


3.fsync函数:将内核缓冲区数据刷新到磁盘中。

小知识

1.重定向的全写是 数字>文件名 ,平常简写为 >文件名 ,默认是把1(标准输出)重定向。

>log.txt 2>&1这样可以把标准输出和标准错误都放到一个文件中。

2.&> 和 >& 是 bash 的快捷方式,表示将标准输出和标准错误输出都重定向到同一个文件。

相关推荐
Web3探索者1 天前
可视化服务器管理和传统命令行区别是什么?新手教程:Linux 运维到底该用图形界面还是 SSH 命令行?
linux·ssh
zylyehuo1 天前
Linux系统中网线与USB网络共享冲突
linux
荣--1 天前
一键部署不是为了省时间 —— 它是把"买来的 PaaS"变成"自己的平台"的拐点
运维·zabbix·工程化·一键部署·平台化·边界设计
江华森1 天前
动手实战学 Docker — 从零到集群编排完全指南
运维
Avan_菜菜2 天前
FRP 内网穿透完整实战:从 HTTP 映射到 HTTPS 自签代理
运维·nginx·https
Sokach10152 天前
Linux Shell 脚本从零到能用:一个新手的一天学习总结
linux
SelectDB3 天前
Litefuse 开源并推出单进程轻量模式,25 秒就能跑起来的 Agent 可观测与评估平台
运维·后端·自动化运维
AlfredZhao3 天前
Docker 容器时区不对,`timedatectl` 不存在怎么办?
linux·timezone
zzzzzz3104 天前
9K Star 炸裂开源!这个 C 语言写的代码知识图谱,把 Linux 内核索引压缩到了 3 分钟
linux·服务器·sql
XIAOHEZIcode4 天前
Linux系统鼠标偏移常见原因以及修复方案
linux·运维·游戏