Linux学习之路 -- 进程 -- 进程间通信 -- 管道通信

本文主要介绍进程通信中的管道通信。

前面我们学习进程的过程中,我们知道,进程是具有独立性的。这也就导致了进程不能够直接地把数据进行传递。为了实现进程之间地通信,我们就需要通过另外地方式来实现进程之间数据地传递。

1.进程通信的目的

首先,在正式学习进程间通信前,我们需要了解进程间通信的目的

<1>数据传输:一个进程需要将它的数据发送给另一个进程

<2>资源共享:多个进程之间共享同样的资源。

<3>通知事件:一个进程需要向另一个或一组进程发送消息,通知它(它们)发生了某种事件(如进程终止时要通知父进程)。

<4>进程控制:有些进程希望完全控制另一个进程的执行(如Debug进程),此时控制进程希望能够拦截另一个进程的所有陷入和异常,并能够及时知道它的状态改变。

总的来说,就是我们往往需要多个进程进行协作,完成一些事情。

2.管道通信的相关原理

1.一般规律

假设我们有两个进程,我们要实现这两个进程之间的数据通信,肯定是不能把一个进程上的数据直接拷贝到另一个进程的空间上,这样的作法无法保证进程之间的独立性。所以我们需要通过一块(内存)空间来实现两个进程之间的数据。同时,这块空间还不能由通信双方任何一个提供,如果是由其中一个提供,那就允许另一个进程访问,这会破坏进程的独立性。

所以进程间通信的本质就是让不同的进程看到同一块空间资源 ,这块资源一般由OS提供。而OS提供的"空间"有不同的样式,就决定了不同的通信方式。

2.实现方式

前面我们在介绍文件时,我们了解到进程是通过文件描述符表来控制文件的。其中一个文件被不同的方式打开是要占据不同的文件描述符的,而我们再创建一个子进程时,文件描述符表也会跟着创建一份,但是里面的内容是和父进程一致的。这两个进程都会指向同一个文件。


这里父子进程就指向了同一块空间,并且这块空间是由操作系统提供,说明我们可以通过文件的方式,来实现进程之间的通信。这种通信的方式就叫做管道通信

管道通信只能被设计成单向的通信,也就是一个进程读,另一个进程写。正常情况下,我们要以读方式和写方式分别打开两次文件,在不同的进程中关闭不同的文件描述符,这样做是为了让父子进程都可以当作读端或写端。我们把父进程以读方式打开的文件描述符关闭,把子进程以写方式打开的文件描述符关闭,这样就可以实现父进程写,子进程读。

相关接口

为了支持管道通信,系统给我们提供相关的系统接口

<1>pipe

int pipefd[2]是输出型参数,用于存放两个fd,分别是以读和写方式打开的文件描述符。通过该接口,我们就不需要向磁盘中刷新和向磁盘中创建文件。通俗的说,就是创建内存级的文件,叫匿名文件(管道)。这个文件不用把数据加载到磁盘,也不用实现标准输入、输出、错误等等。

匿名管道通信的特点,就是只能让有血缘关系的进程,进行进程间通信(常用于父子进程)

这个接口如果返回零,那么就表示调用成功,如果失败了,就返回-1。如果成功调用,那么pipefd[0]中存放的是读端的文件描述符,而pipefd[1] 中存放的是写端的文件描述符。

下面我们可以用一段代码验证上述的结论

#include<stdio.h>
#include<unistd.h>

int main()
{
    int pipefd[2];
    int n = pipe(pipefd);
    if(n < 0) return 1;
    printf("%d %d\n",pipefd[0],pipefd[1]);
    return 0;
}

运行结果

下面简单实现一下,用父子进程间进行通信

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<string.h>
#include<unistd.h>
#include<stdlib.h>

void Write(int wfd)
{
    const char* str = "hello linux";
    char buffer[1024];
    int pid = getpid();
    while(1)
    {
        snprintf(buffer,sizeof(buffer),"pid:%d str:%s\n",pid,str);
        write(wfd,buffer,sizeof(buffer));
    }

}
void Read(int rfd)
{
    int cnt = 20;
    char buffer[1024];

    while(cnt--)
    {
        ssize_t n = read(rfd, buffer,sizeof(buffer));
        (void)n;
        printf("%s", buffer);
        sleep(1);
    }
}

int main()
{
    int pipefd[2];
    int n = pipe(pipefd);
    if(n < 0) return 1;
    printf("%d %d\n",pipefd[0],pipefd[1]);
    pid_t id = fork();
    //写端
    if(id == 0)
    {
        close(pipefd[0]);
        Write(pipefd[1]);
        exit(0);
    }
    //父进程
    close(pipefd[1]);
    Read(pipefd[0]);
    wait(NULL);
}

运行结果

这样我们就实现父子进程的简单通信。

关于管道通信的几种情况。

<1>管道内部没有数据 && 子进程不关闭自己的写端文件fd,读端(父进程)就要阻塞等待,直到管道有数据。

<2>管道内部被写满了 && 读端(父进程)不关闭自己的fd,写段(子进程)写满之后,就要阻塞等待。管道的默认大小是4kB(unbantu 20.04版本下)。在这种情况下,读端会尽可能多的读取数据,当读取到一定数量的数据时,写端又会重新向管道写入数据。

<3>对于写端而言,不写了&&关闭了管道,读端会将pipe中的数据读完,最后就会读到返回值为0,表示读结束,类似与读到文件的结尾。

<4>读端不读&&关闭,写端在写,OS会直接终止写入的进程(子进程),通过信号(13 SIGPIPE)进程终止。(下图是让读端关闭(父进程),写端(子进程)继续写,并打印出退出码和退出信号)。

管道的几种的特性

<1>自带同步机制,也就是执行时有一定的顺序。

<2>有血缘关系之间的通信

<3>管道是面向字节流的(读端和写端的次数没有直接的联系)

<4>父子进程退出,管道自动的释放,文件的声明周期是随进程的。

<5>管道只能单向通信。半双工的一种特殊情况

而我们学习的命令行管道,本质上也就是本文所述的管道。而我们在使用命令行管道时,一个命令就是一个进程,一个竖划线就是一个管道,这些进程的父进程都是bash进程。

应用场景:进程池。

由于我们每次创建进程都要向系统中进行申请,这个过程比较麻烦,所以我们可以直接先申请多个进程,由一个主进程进行控制,每个进程都和父进程之间创建管道,这个就叫进程池。在创建完毕后,我们可以进程池内的进程分配任务,一个进程不能执行全部的任务,而是要让所有的进程都执行一些任务,这个分配规则就叫负载均衡。

命名管道

匿名管道适用于父子进程之间的通信,而我们如果要在完全不相干的两个进程之间进行通信,就需要使用命名管道。

如上图所示,当我们进程A和进程B以不同的方式打开file.txt时,正常来说会生成两个文件缓冲区,但是由于两个文件缓冲区内容是一样的,所以我们就只需要一个文件缓冲区即可。由于此时的文件缓冲区是不需要向文件中刷新数据的(会浪费空间,而且没必要),所以文件缓冲区就可以作为一个管道,实现两个进程之间的通信。

如何保障两个打开的是同一个文件呢(也就是确保同一缓冲区)?我们可以使用文件的路径+文件名的方式锁定文件,这样可以保证打开的就是同一文件。

具体方法:

我们可以使用mkfifo命令创建管道,然后在实现两个进程之间的通信。

相关推荐
hgdlip2 分钟前
查看ip地址的方法有几种?探索多样方法
运维·服务器·ip地址
丶213615 分钟前
【Nginx】在 Docker 上安装 Nginx 的详细指南
运维·nginx·docker
神即道 道法自然 如来31 分钟前
Jenkins怎么设置每日自动执行构建任务?
运维·jenkins
小黑爱编程38 分钟前
【LInux】HTTPS是如何实现安全传输的
linux·安全·https
BeyondESH43 分钟前
Linux线程同步—竞态条件和互斥锁(C语言)
linux·服务器·c++
hanniuniu131 小时前
详细解读,F5服务器负载均衡的技术优势
运维·服务器·负载均衡
鱼饼6号1 小时前
Prometheus 上手指南
linux·运维·centos·prometheus
Asher Gu1 小时前
Linux系统编程入门 | 模拟实现 ls -l 命令
linux
c无序1 小时前
【Linux进程控制】进程程序替换
linux
潮汐退涨月冷风霜2 小时前
机器学习之非监督学习(四)K-means 聚类算法
学习·算法·机器学习