进程间通信

1.什么是通信

数据传输：一个进程需要将自己的数据传输给另一个进程
资源共享：多个进程同时共享一个资源
进程事件：一个进程向一组（或一个）进程通知某一事件，如：子进程结束要通知父进程来回收资源
进程控制:有些进程需要知道另一个进程的状态，控制拦截另一个进程陷入异常等，如：gdb调试

2.为什么要有通信

多个进程之间需要协同来完成某项任务：

eg:

shell 复制代码

cat log.txt | gerp "hehe"

具备通信的的前提条件：

因为进程具有独立性，所以不能在两个进程各自的区域来进行通信，就好比警察和黑帮的卧底，需要用纸条来通信，所以不能在各自的地盘,所以OS需要给需要通信的进程提供一个内存空间
并且两个进程之间都可以看到一个公共的资源（空间）

操作系统的很多模块都可以提供公共空间

3.进程间通信分类

管道通信

匿名管道

命名管道

System V IPC

System V 消息队列

System V 共享内存

System V 信号量

POSIX IPC

消息队列

共享内存

信号量

互斥量

条件变量

读写锁

4.管道

对于文件系统来说，被打开的文件在文件描述符表里有对应的fd (文件描述符)

当一个进程fork()后，子进程会拷贝父进程的大部分资源 ，其中就包括文件struct files_struct，当然，**file* fd_array **也拷贝过去，即文件描述符表

所以子进程能指向和父进程同一个被打开的文件所以子进程创建后，打开的文件和父进程指向的是同一个文件

此时就初步具备了通信的条件，这个空间是由文件系统提供的，文件在磁盘里

但是，文件系统需要访问外设(即磁盘)，所以访问速度相对较慢

4.1管道文件的定义和实现

有一种内存级的文件，他没有对应的磁盘文件，但是有自己的file结构体,这个实现是操作系统本身用联合体实现的，这个细节实现是OS去操作的。

对于每个struct file都有

1.file的操作办法 2. 内核缓冲区

对于一个struct file，可以不指向磁盘中的文件，因为这个实现是操作系统来实现的
所以操作系统在内存中创建一个不指向磁盘中任何文件的struct file ，即只有一个结构体，这个结构体里当然也具备了1.file的操作办法 2. 内核级缓冲区,所以进程之间可以通过这个匿名文件的缓冲区来进行通信
当父进程打开一个内存级文件的时候，fork子进程，子进程也具备了指向该内存级文件，所以父子进程可以用这个内存级文件来进行通信 ，不需要访问磁盘就可以完成，所以速度就会大大提升，这个文件没有名字，所以叫做匿名管道
如下图

这种父子进程之间，用内核级文件进行通信的文件称为：管道文件

4.2 管道的创建过程

管道在生活中就是用来单向传输的，一头输入一头只输出

管道需要读和写，所以一个父进程需要同时具备读和写权限的属性才能fork子进程，要不然子进程没办法进行读或者写

但是又不能父子进程两个都写，或者都读，只能一方写，一方读

所以创建过程如下：

1.父进程以读和写方式分别打开一个内存级文件

2.父进程fork()子进程，这样一来，子进程也都具备了对该内存级文件读和写的方式

关掉一个读的和一个写的fd,如果没关，万一没关可能会被不小心访问到

⭐管道是一个父进程分别以读和写方式打开一个内存级文件，并通过fork创建一个子进程，各自再关闭对应的读写端，进而形成一条通信信道，这样的信道是基于文件的，所以叫做：管道

匿名管道：目前只能用来进行父子进程间通信

4.3 pipe创建管道

c 复制代码

#include <unistd.h>
//功能:创建一无名管道
//原型
int pipe(int fd[2]);
//输出型参数
fd：文件描述符数组,其中fd[0]表示读端, fd[1]表示写端
返回值:成功返回0，失败返回错误代码

联想记忆法 : 1. fd $0$ ：0比作嘴巴，读东西，读端
复制代码
  					2. fd[1]:   1比作笔，写东西，写端 

在fork子进程后，父子进程是读还是写，那么就关闭不用的一个，fork()之后各自关掉不用的描述符

4.4 匿名管道的读写特征

读慢，写快

写的速度>读的速度，管道也是有最大容量的

所以当管道被写满时，将不在继续写，直至读端读走数据有可以写的空间，写端才继续写
读快，写慢

读的速度>写的速度

因为读速度大于写速度，所以当读端读完管道内的内容时，此时已经没有内容可读了，那么进程将阻塞在read函数这里，等待写端写，直至管道内有数据可继续读
写端关闭，读端不关闭

当管道写端关闭时，读端读完管道内的数据时，如果再次去读没有数据的管道会返回0，相当于读到了EOF
读端关闭，写端不关闭

读关闭，操作系统将给进程法信号，终止写端，因为不需要读的话，就是浪费系统资源，操作系统会强制终止写端

4.5 命名管道

1.mkfifo函数创建命名管道

c 复制代码

#include<sys/types.h>
#include<sys/stat.h>

int mkfifo(const char *pathname,mkde_t mode);

参数

pathname : 要创建命名管道的目录和文件名

返回值
复制代码
```
  成功返回 0 ，失败返回  -1
```
命名管道的文件类型是**p**

2.命名管道的原理

在进程中打开命名管道文件的方法跟普通文件一样

文件从磁盘中加载到内存，然后创建struct file,然后将其地址放到task_struct中的files_struct中的文件描述符表中
但是不一样的是，我们只与struct file中的内核缓冲区交互，读写的内容都保存在struct file中的缓冲区中，自始至终没有将内容写到磁盘，磁盘文件相当于一个载体，只是为了给我们提供一个struct file
如下图流程

3.两个无血缘进程间的通信

让两个进程看到同一份命名管道，然后分别选择一个读和写

注意细节：当只有一端打开命名管道时，eg:只打开读端，另一端还没就绪，此时打开的一端会阻塞自己，等待另一端就绪

5.共享内存

共享内存区是最快的IPC形式，一旦这个shm与进程地址空间映射，那么无需通过内核进行通信，直接通过一个内存进行通信，但是由于共享内存只能在本地进行多个进程间通信，所以就慢慢的被淘汰掉了了

5.2 共享内存的原理

首先要拿到一个key，生成一个独一无二的key，其他进程（人）进来需要key，创建共享内存时候要传这个key就好比开个房间
然后让进程的进程地址空间与这个共享内存区域建立映射关系，这样进程就拿到了读写共享内存的功能
此时进程之间就具备了通信的基本能力:看到同一份公共资源，就可以进程进程之间通信了

如上图，通过页表映射到各自的进程地址空间，从而实现两个进程可以实现进程间通信

5.3 共享内存的实现

①创建key*

c++ 复制代码

#include <sys/types.h>
#include <sys/ipc.h>
key_t ftok(const char *pathname, int proj_id);
//pathname放一个指定的路径即可，proj_id指定一个数值即可，但是记得另一个进程对应得这两个参数也要一样

②创建共享内存

c++ 复制代码

#include <sys/ipc.h>
#include <sys/shm.h>
int shmget(key_t key, size_t size, int shmflg);
//key即上边得Key , size为开辟共享内存得大小单位是字节

参数：shmflg 是一个用标志位代表的一个参数有两个IPC_CREAT,IPC_EXCL

IPC_CREAT : 如果没有那么创建共享内存，如果已经有了，那么返回共享内存的shmid

IPC_EXCL : 该宏必须和IPC_CREAT一起使用，否则没有意义。当shmget取IPC_CREAT|IPC_EXCL时，表示如果发现信号集已经存在，则返回-1，错误码为EEXIST。
创建时必须加上创建共享内存的权限码0600

c++ 复制代码

//1.创建时一般用下边这个
int shmid=shmget(key,4096,IPC_EXCL|IPC_CREAT|0600);
//2.获取时用下边的这个
int _shmid=shmget(key,4096,IPC_CREAT);

**返回值：**成功返回共享内存的shmid，失败返回-1

③共享内存与进程创建联系 shmat 函数

c++ 复制代码

void *shmat(int shmid, const void *shmaddr, int shmflg);

参数: hm_addr指定共享内存连接到当前进程中的地址位置，通常为空（nullptr），表示让系统来选择共享内存的地址。
shm_flg是一组标志位，通常为0

**④断开与共享内存链接 shmdt()函数 **

c++ 复制代码

int shmdt(const void *shmaddr);

参数shmaddr是shmat()函数返回的地址指针，调用成功时返回0，失败时返回-1.

⑤控制共享内存 : shmctl()函数

c++ 复制代码

int shmctl(int shmid, int cmd, struct shmid_ds *buf);

IPC_STAT：把shmid_ds结构中的数据设置为共享内存的当前关联值，即用共享内存的当前关联值覆盖shmid_ds的值。

IPC_SET：如果进程有足够的权限，就把共享内存的当前关联值设置为shmid_ds结构中给出的值

IPC_RMID：删除共享内存段

返回值 : 失败返回 -1

6.信号量

信号量：信号量本质是一个计数器，用来表示公共资源中可用的数量
公共资源：可用被多个进程同时访问的资源，叫做公共资源

为什么要让不同的进程看到同一份公共资源呢---->为了不同进程之间进行通信，协同工作等 ------>那么就让不同的进程看到同一份资源------->提出产生公共资源的方法----->过程中遇到问题------>数据不一致问题，比如还没有写完另一边就开始读取了

临界资源： 被保护起来的公共资源被称作临界资源(临界资源占少数，因为大部分资源都是各自进程自身的，只有进程要通信并且防止被打扰才会进行保护，所以临界资源在这个条件下占少数)
临界资源(内存，文件，网络等)是要被使用的，如何被进程使用呢？进程存在对这部分资源的使用方法代码，由这部分代码来实现，那么这部分代码区域被称作临界区 ，其他区域则被称作非临界区
如何保护：互斥和同步
原子操作 ：对于一件事情 , 要么就一开始就不做，要么做了就做完
对于共享资源的使用：1.作为一个整体 2.拆分成若干个部分使用

所有的进程在访问公共资源的前提下，需要先申请信号量------>所以必须进程都能看到信号量，那么信号量也是一个公共资源----->所以信号量也要保证自己的安全------->所以信号量进行++或者- -操作是原子性的

那么，对于信号量获取资源进行信号量--的操作被称为P操作

对于信号量回收资源进行信号量++的操作被称为V操作

7. IPC资源的组织方式

系统的IPC资源常见的有：消息队列，共享内存，信号量等

这些资源都包括了两个结构体：1.自身的结构体例如struct shm_ds或者sem_ds 2.struct ipc_prem

这些资源是由OS统一管理的，OS会创建一个数组 : ipc_prem *prems[ ];，由这个数组统一管理ipc资源

在创建对应得ipc资源时，会先创建一个自身类型得结构体，比如shm就会创建shm_ds
对于一个结构体，结构体的起始地址==结构体第一个元素的地址，所以对于每个ipc资源的自身结构体，有以下内容，其中第一个元素为创建了一个ipc_prem对象，然后将其地址放到OS的prems数组中，以方便统一管理，这样，OS就会知道管理诸多ipc资源中，所要处理的当前ipc资源类型是什么了
例如 : prems $0$ =&semid_ds.sem_prem;