【Linux探索学习】第十二弹——初识进程：进程的定义、描述和一些简单的相关操作

Linux学习笔记：

https://blog.csdn.net/2301_80220607/category_12805278.html?spm=1001.2014.3001.5482

前言：

在前面经过那么多篇的铺垫后，今天我们正式进入Linux学习的第一个重难点------进程，理解进程对于我们学习操作系统的其它部分，尤其是多文件处理和资源管理十分重要，下面我们正式进入进程的第一篇讲解

五、通过系统调用创建进程------初识fork

六、总结

一、进程概念

进程是一个正在执行的程序的实例。它不仅包括程序的代码，还包括程序的当前活动、寄存器、程序计数器、堆栈及其所有与执行相关的资源。简单来说，进程是一个程序在运行时的一个动态实体。

需要注意的一点是进程的程序是一定被加载在内存中的，因为进程是系统将要进行处理的数据，而CPU是从内存中获取数据的，所以说进程的程序一定被加载在内存中的，比如我们vim写的一个.c的C语言程序，它在操作系统下的本质就是一个文件，是存放在外设中的，当运行起来时，我们就会将它的相关数据存放到内存中去，以便于CPU直接获取

二、进程描述

一个操作系统可能可以同时进行多个进程，比如我们可以让多个程序同时进行，我们的电脑可以同时跑多个软件，为了避免进程执行起来互相干扰，所以我们要对进程进行管理

一般进行管理的过程就是：先描述+再组织

所以我们要进行进程描述：任何一个进程，在被加载到内存，形成真正的进程时，操作系统都要先创建描述进程的结构体对象------PCB，也叫做进程控制块，可以理解为进程属性的集合，操作系统是C语言写的，所以PCB一定是一个struct结构体，PCB中会包含进程如下的重要信息：

进程ID（PID）：唯一标识一个进程的编号。

进程状态：当前进程的状态。

程序计数器：指向当前执行指令的地址。

CPU寄存器：进程在执行时的寄存器内容。

内存管理信息：如页表和段表。

进程优先级：调度时的优先级信息。

此外为了方便管理进程，处理进程与进程之间的关系，进程在内存中是以队列的形式存在的，具体点来讲就是链表（双链表），进程在内存中的存在形式可以抽象为下图：

由于PCB中包含着进程的所有信息，所以对进程管理的本质其实就是对进程的PCB做管理，进程在操作系统又通过队列进行链接，所以对进程的管理，其实就是对链表的增删改查

这里的PCB是针对所有操作系统而言的，在我们的Linux中我们往往习惯称呼这个概念为task struct

三、查看进程

在上面我们讲到进程的许多属性，包括进程编号、进程状态等等许多内容

首先我们可以通过查看/proc/文件，来查看我们目前正在执行的全部进程

cpp 复制代码

ls /proc/

这些数字就是进程的PID，每个进程都会有一个对应的PID，PID就是我们上面所说的进程ID，也叫做进程标识符，我们可以通过这些进程标识符来查看每个进程具体的信息，比如查看1号进程

cpp 复制代码

ls /proc/1

除了上面的这个方法外，我们还可以通过下面这个指令，不仅可以看到所有的进程，还可以看到它们的进程的属性信息：

cpp 复制代码

ps axj

我们节选一部分：

执行结果的第一行就是我们的进程属性信息的列名，下面就是每个进程对应的属性信息，我们可以只打印出一行来看一下进程属性的内容（需要借助之前的知识：管道 | 和打印行数head）

cpp 复制代码

ps axj | head -1

对于这些属性信息中，我们先记住前两个就行了，PPID指的是父进程标识符，PID知道是当前进程标识符

目前我们自己创建的可执行文件有test

我们可以查看下我们自己创建的这个进程的相关信息（注意只有当我们的程序在跑着的时候它才叫进程，所以我们可以将我们的程序写成一个死循环，然后让它执行起来）

cpp 复制代码

ps axj | head -1 && ps axj | grep test

观察这个执行结果，我们可以发现有两个相关进程，会出现第二条的原因就是执行查找test进程的命令本身也会成为一个进程，而这个进程中含test，所以会把自身也带上

如果不想要，可以在后面加上 | grep -v grep，这个-v选项我们在前面讲指令的时候是讲过的，是反向匹配的意思

cpp 复制代码

ps axj | head -1 && ps axj | grep test | grep -v grep

四、通过系统调用获取进程标识符

除了上面获取进程标识符的方法外，我们还可以通过系统调用的方式来获取表示符，系统接口为getpid和getppid，我们可以通过man手册来查看这个接口

cpp 复制代码

man 2 getpid

具体方法如下：

cpp 复制代码

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
 printf("pid: %d\n", getpid());
 printf("ppid: %d\n", getppid());
 return 0;
}

多次执行这个程序，我们会发现pid一直在变化，而ppid一直不变，也就是说子进程编号一直在变化，而父进程一直没变，为什么会出现这个现象呢？

这是因为，我们在打开Linux时，会首先创建一个bash进程，形成对话框，这个bash进程也是其它所有进程的子进程，所以一般代码重新运行时，它的子进程编号会变，而父进程编号不会变

我们可以创建一个监视窗口方便观察（了解）：

cpp 复制代码

while :; do ps axj | head -1 ; ps axj | grep test | grep -v grep; 
echo "----------------------------"; sleep 1 ; done

五、通过系统调用创建进程------初识fork

我们可以通过fork手动创建进程，我们可以通过man手册查看一下fork

cpp 复制代码

man fork

我们先来看下面的一个小程序：

cpp 复制代码

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
     printf("before test");
     fork();
     printf("after test");
     return 0;
}

运行结果：

我们注意到在fork()函数之后的第二行打印语句执行了两次，说明在fork()之后一个进程变成了两个进程

此外，fork函数还有一个重要知识就是它是有两个整形返回值的，这点与我们之前所学的C语言中的函数差别很大，因为我们之前所学的函数都是只有一个返回值，fork的两个整形返回值中，大于0代表父进程，等于0是子进程

我们下面来看这样一个程序来验证一下：

cpp 复制代码

  1 #include<stdio.h>
  2 #include<sys/types.h>
  3 #include<unistd.h>
  4  
  5 int main()
  6 {
  7     pid_t id=fork();
  8     if(id>0)
  9     {
 10         //父进程
 11         printf("I am parent process, pid:%d, ppid:%d\n",getpid(),getppid());
 12     }
 13     else if(id==0)
 14     {
 15         //子进程
 16         printf("I am child process, pid:%d, ppid:%d\n",getpid(),getppid());
 17     }
 18     printf("hello linux\n");
 19     return 0;
 20 }

在这个函数中我们尝试将父子进程分开，并且在最后有一个公共代码区，执行结果：

我们可以看到子进程的ppid就是父进程的pid，所以也印证了它们的父子关系，而且最后一个打印代码父子进程都执行了

相信不少同学对上面的问题已经有了很大的疑惑了，比如fork为什么要给子进程返回0，给父进程返回子进程pid呢？其实这就是为了区分父子进程，让不同的执行流执行不同的代码

一般而言fork之后的代码是共享的，这也就是为什么上面的 "hello linux" 打印了两遍的原因，因为父子进程都执行了它，那么如果此时子进程对共享数据进行操作了，我们就需要对额外操作的数据开辟新空间，这就是写时拷贝，这我们会在后面详细讲解

至于为何pid_t id中的id可以取两个值，这也需要我们后面讲到进程空间地址的问题时再提，现在只需要也简单地理解为写时拷贝就可以了

六、总结

以上就是今天讲解的进程的基础内容，篇幅较长，文字较多，相信认真看完的你会有所收获，后面我们就将开启进程知识的深度讲解

感谢各位大佬观看，创作不易，还请各位大佬点赞支持！！！