文件-语言-系统:基础IO-2.0——IO重定向接口,语言层缓冲区,系统级缓冲区。内核级分析!

@bit::Shadow
✧(≖ ◡ ≖✿

目录

重定向接口dup2()

[">" ">>" "<"](#">" ">>" "<")

函数原型

输出重定向1和2的使用

文件描述符表

./a.out运行:

["./a.out >"默认重定向是fd == 1](#"./a.out >"默认重定向是fd == 1)

合并标准输入输出

缓冲区

什么是缓冲区?

缓冲区的意义?

语言与系统中的缓冲区

语言级

文件操作

fd未提前关闭:

fd提前关闭:

系统调用接口较于库函数的强关联性

为什么stdout下write在最后打印到文件内却是第一个打印呢?

父子进程分别退出导致语言层缓冲区双倍刷新

原因:

为什么设计"语言层"与"系统层"缓冲区分离的机制?


衔接上篇文件IO-1.0

重定向接口dup2()

">" ">>" "<"

">"输出重定向,清空并新写入。

">>"追加重定向,追加内容到指定文件/流。

"<"输入重定向,例:cat < log.txt 就是 cat log.txt 。

++标准输出1与标准错误2指向的均是标准错误,不过fd不同。++

函数原型

int dup2(int oldfd, int newfd);

功能:基于++操作系统"只认文件标识符fd"来定位输出对象的前提++ ,让newfd指向oldfd指向的文件/设备成功则返回新fd否则返回-1。

当我们进行以fd标识的输入输出读取等操作时,就会因为"fd"的重定向导致操作对象改变!

例:

dup2(fd, 1); //将标准输出流内的数据写入到fd指向的文件内。

cpp 复制代码
int main()
{
    int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
    //fd == 3
    dup2(fd, 1);
    printf("预备标准输出流内容\n");
    const char* s = "nihao\n";
    write(fd, s, strlen(s));
    close(fd);
    return 0;
}

运行发现显示器并未出现:"预备标准输出流内容"的输出而是文件log.txt内被写入。

由此也可以体现:Linux作为独立于Win操作系统的存在,正是其操作系统默认打开的0:标准输入流,1:标准输出流及2:标准错误流。文字/符号/图形才得以显示。

输出重定向1和2的使用

文件描述符表

OS只识别文件fd:

☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆

☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆

1:标准输出流

2:标准错误流

两者均是像显示器打印。

运行以下代码:

cpp 复制代码
#include <cstdio>
#include <iostream>

int main()
{
    //向标准输出进行打印,stdout,cin->1
    std::cout << "hello cout" << std::endl;
    printf("hello printf\n");

    //向标准错误进行打印,stderr,cerr->2,
    std::cerr << "hello cerr" << std::endl;
    fprintf(stderr, "hello stderr\n");

    return 0;
}

./a.out运行:

"./a.out >"默认重定向是fd == 1

err内容输出到屏幕:

./a.out 2 :

合并标准输入输出

./a.out > log.txt 2 >&1

错误方式:./a.out > log.txt 2 >> 1

缓冲区

什么是缓冲区?

简单理解:缓冲区是一块内存区域

缓冲区的意义?

尽量集中数据、同时处理,提高交互效率。

语言与系统中的缓冲区

语言层系统层分别有自己的缓冲区,两者缓冲区的关系是各自独立但间接相关。

语言级

缓冲区刷新条件:

1.强制刷新。如:fflush()函数

2.满足特定条件自动刷新。例:缓冲区满、行刷新/行缓冲"\n"。

3.进程退出。如:程序结束、exit(-1)强制退出。

文件操作

语言对文件的操作本质是系统对磁盘的IO管理,因此涉及到语言层缓冲区与系统层缓冲区的交互。

(非全缓冲是行缓冲(一般缓冲))语言缓冲区到系统缓冲区传递条件:fd(文件标识符)+ 系统调用(像:write())

printf/fprintf/fwrite/fputs均是库函数,本质内部均封装 "write"。

也就是说若fd使用close提前关闭就会输出混乱。

fd未提前关闭:
fd提前关闭:

语言采用行刷新后关闭

不会输出在fd:

原因及解决方案:

\n 触发行缓冲刷新是 C 标准 I/O 行为 而不是文件描述符的概念 ,前提是 stdout 被终端关联且缓冲模式是行缓冲。如果你发现 log.txt 没有内容,说明 stdout 在程序启动时就不是行缓冲(例如被重定向或从非终端启动),应使用 fflush(stdout) 强制刷新。

系统调用接口较于库函数的强关联性

write为例:

将buf内容写到fd指向的文件内

cpp 复制代码
#include <unistd.h>

ssize_t write(int fd, const void *buf, size_t count);

显示器与文件操作下的对比:

代码:

cpp 复制代码
void test4()
{
    //三种库函数写入到显示器
    printf("printf\n");
    fprintf(stdout, "fprintf\n");
    const char* s = "fwrite\n";
    fwrite(s, strlen(s), 1, stdout);

    //系统调用
    const char* ss = "write\n";
    write(1, ss, strlen(ss));
}

显示器:

文件:

为什么stdout下write在最后打印到文件内却是第一个打印呢?

原因:因为语言层IO想要进入文件必须经"语言---系统层面"的区域转换,作用时"write系统调用"下距离OS缓冲区更近,因此优于库函数写入到文件内。而呈现出虽然代码从上向下执行但系统调用优先特殊逻辑关系链。

父子进程分别退出导致语言层缓冲区双倍刷新

cpp 复制代码
int main()
{
    //库函数
    printf ("hello printf\n");
    fprintf (stdout, "hello fprintf\n");
    const char *s = "hello fwrite\n";
    fwrite (s, strlen (s), 1, stdout);

    //系统调用
    const char *ss = "hello write\n";
    write (1, ss, strlen (ss));

    //???
    fork();
}

运行:

原因:

PCB下双层退出导致二次刷新,从而形成了文件IO双倍的现象:


为什么设计"语言层"与"系统层"缓冲区分离的机制?

系统调用是操作系统亲临执行任务,操作系统是最忙的存在。简而言之:**系统调用成本太高!**的像malloc时顺序表时两倍的扩容机制、vector、tcmalloc等设计均是为优化这一影响而设计出的解决方案。

感谢观看

求关注

相关推荐
Shadow(⊙o⊙)13 小时前
Qt-Lambda捕获使用+阶段性综合使用
开发语言·c++·qt·qt5
玖釉-13 小时前
「接雨水」问题的算法建模与双指针优化分析
c++·windows·算法
码农小旋风13 小时前
大语言模型基础
开发语言·人工智能·语言模型·自然语言处理·chatgpt·claude
志栋智能13 小时前
超自动化巡检:连接运维数据孤岛的桥梁
运维·网络·人工智能·自动化
Kingairy13 小时前
Dockerfile
linux·运维·服务器
灰子学技术13 小时前
Envoy OAuth2 过滤器功能实现分析
运维·服务器·前端·网络
OpsEye13 小时前
线上Kafka积压后,我是怎么处理的
运维·kafka·监控
Agent手记13 小时前
跨系统自动化技术演进:实在Agent的屏幕语义理解如何替代API和坐标脚本
运维·自动化