文件-语言-系统:基础IO-2.0——IO重定向接口,语言层缓冲区,系统级缓冲区。内核级分析!

@bit::Shadow
✧(≖ ◡ ≖✿

目录

重定向接口dup2()

[">" ">>" "<"](#">" ">>" "<")

函数原型

输出重定向1和2的使用

文件描述符表

./a.out运行:

["./a.out >"默认重定向是fd == 1](#"./a.out >"默认重定向是fd == 1)

合并标准输入输出

缓冲区

什么是缓冲区?

缓冲区的意义?

语言与系统中的缓冲区

语言级

文件操作

fd未提前关闭:

fd提前关闭:

系统调用接口较于库函数的强关联性

为什么stdout下write在最后打印到文件内却是第一个打印呢?

父子进程分别退出导致语言层缓冲区双倍刷新

原因:

为什么设计"语言层"与"系统层"缓冲区分离的机制?


衔接上篇文件IO-1.0

重定向接口dup2()

">" ">>" "<"

">"输出重定向,清空并新写入。

">>"追加重定向,追加内容到指定文件/流。

"<"输入重定向,例:cat < log.txt 就是 cat log.txt 。

++标准输出1与标准错误2指向的均是标准错误,不过fd不同。++

函数原型

int dup2(int oldfd, int newfd);

功能:基于++操作系统"只认文件标识符fd"来定位输出对象的前提++ ,让newfd指向oldfd指向的文件/设备成功则返回新fd否则返回-1。

当我们进行以fd标识的输入输出读取等操作时,就会因为"fd"的重定向导致操作对象改变!

例:

dup2(fd, 1); //将标准输出流内的数据写入到fd指向的文件内。

cpp 复制代码
int main()
{
    int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    //fd == 3
    dup2(fd, 1);
    printf("预备标准输出流内容\n");
    const char* s = "nihao\n";
    write(fd, s, strlen(s));
    close(fd);
    return 0;
}

运行发现显示器并未出现:"预备标准输出流内容"的输出而是文件log.txt内被写入。

由此也可以体现:Linux作为独立于Win操作系统的存在,正是其操作系统默认打开的0:标准输入流,1:标准输出流及2:标准错误流。文字/符号/图形才得以显示。

输出重定向1和2的使用

文件描述符表

OS只识别文件fd:

☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆

☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆

1:标准输出流

2:标准错误流

两者均是像显示器打印。

运行以下代码:

cpp 复制代码
#include <cstdio>
#include <iostream>

int main()
{
    //向标准输出进行打印,stdout,cin->1
    std::cout << "hello cout" << std::endl;
    printf("hello printf\n");

    //向标准错误进行打印,stderr,cerr->2,
    std::cerr << "hello cerr" << std::endl;
    fprintf(stderr, "hello stderr\n");

    return 0;
}

./a.out运行:

"./a.out >"默认重定向是fd == 1

err内容输出到屏幕:

./a.out 2 :

合并标准输入输出

./a.out > log.txt 2 >&1

错误方式:./a.out > log.txt 2 >> 1

缓冲区

什么是缓冲区?

简单理解:缓冲区是一块内存区域

缓冲区的意义?

尽量集中数据、同时处理,提高交互效率。

语言与系统中的缓冲区

语言层系统层分别有自己的缓冲区,两者缓冲区的关系是各自独立但间接相关。

语言级

缓冲区刷新条件:

1.强制刷新。如:fflush()函数

2.满足特定条件自动刷新。例:缓冲区满、行刷新/行缓冲"\n"。

3.进程退出。如:程序结束、exit(-1)强制退出。

文件操作

语言对文件的操作本质是系统对磁盘的IO管理,因此涉及到语言层缓冲区与系统层缓冲区的交互。

(非全缓冲是行缓冲(一般缓冲))语言缓冲区到系统缓冲区传递条件:fd(文件标识符)+ 系统调用(像:write())

printf/fprintf/fwrite/fputs均是库函数,本质内部均封装 "write"。

也就是说若fd使用close提前关闭就会输出混乱。

fd未提前关闭:
fd提前关闭:

语言采用行刷新后关闭

不会输出在fd:

原因及解决方案:

\n 触发行缓冲刷新是 C 标准 I/O 行为 而不是文件描述符的概念 ,前提是 stdout 被终端关联且缓冲模式是行缓冲。如果你发现 log.txt 没有内容,说明 stdout 在程序启动时就不是行缓冲(例如被重定向或从非终端启动),应使用 fflush(stdout) 强制刷新。

系统调用接口较于库函数的强关联性

write为例:

将buf内容写到fd指向的文件内

cpp 复制代码
#include <unistd.h>

ssize_t write(int fd, const void *buf, size_t count);

显示器与文件操作下的对比:

代码:

cpp 复制代码
void test4()
{
    //三种库函数写入到显示器
    printf("printf\n");
    fprintf(stdout, "fprintf\n");
    const char* s = "fwrite\n";
    fwrite(s, strlen(s), 1, stdout);

    //系统调用
    const char* ss = "write\n";
    write(1, ss, strlen(ss));
}

显示器:

文件:

为什么stdout下write在最后打印到文件内却是第一个打印呢?

原因:因为语言层IO想要进入文件必须经"语言---系统层面"的区域转换,作用时"write系统调用"下距离OS缓冲区更近,因此优于库函数写入到文件内。而呈现出虽然代码从上向下执行但系统调用优先特殊逻辑关系链。

父子进程分别退出导致语言层缓冲区双倍刷新

cpp 复制代码
int main()
{
    //库函数
    printf ("hello printf\n");
    fprintf (stdout, "hello fprintf\n");
    const char *s = "hello fwrite\n";
    fwrite (s, strlen (s), 1, stdout);

    //系统调用
    const char *ss = "hello write\n";
    write (1, ss, strlen (ss));

    //???
    fork();
}

运行:

原因:

PCB下双层退出导致二次刷新,从而形成了文件IO双倍的现象:


为什么设计"语言层"与"系统层"缓冲区分离的机制?

系统调用是操作系统亲临执行任务,操作系统是最忙的存在。简而言之:**系统调用成本太高!**的像malloc时顺序表时两倍的扩容机制、vector、tcmalloc等设计均是为优化这一影响而设计出的解决方案。

感谢观看

求关注

相关推荐
yuan199975 小时前
欧拉梁静力与屈曲计算的 MATLAB 实现(有限差分法 + 解析解)
开发语言·算法·matlab
llxxyy卢5 小时前
polar夏季赛部分题目
开发语言·python
AI玫瑰助手5 小时前
Python模块:from...import...导入指定内容
开发语言·python·信息可视化
石山代码5 小时前
JavaScript 进阶核心知识点
开发语言·javascript·ecmascript
A_humble_scholar5 小时前
Linux(九) 进程管理完全指南:从入门到实战
linux·运维·chrome
FL16238631295 小时前
[cmake]基于C++使用纯opencv部署ppocrv5v6的onnx模型
开发语言·c++·opencv
江华森5 小时前
Linux 操作命令完全指南
linux·运维
玖玥拾5 小时前
C/C++ 数据结构(六)链表迭代器与底层
c语言·数据结构·c++·链表·stl库
牛油果子哥q5 小时前
AVL平衡树与红黑树深度精讲对比,平衡因子、四大旋转原理、着色规则、平衡策略、性能差异与面试手撕全解
数据结构·c++·面试