初识Linux · 进程（2）

前言：

本文会开始慢慢切入进程了，当然，切入进程之前，我们需要再次复习一下操作系统，后面接着是介绍什么是进程，如何查看进程，在Linux中对应的文件是哪个等相关的问题，进程大概会持续更新多节，所以说进程的知识点还是相当杂乱的，就更需要同学们予以注意了。

有关进程的相关理解

首先，我们需要知道，为什么需要操作系统？

操作系统的工作是执行软硬件资源的管理，如何管理硬件上文提及的是通过驱动程序，使得硬件的相关数据组织成为一个链表，操作系统可以直接对链表的信息进行修改，驱动程序再对硬件实施管理，这是先描述再组织，从而实现了管理硬件，那么这是操作系统的一个手段，也就是管理硬件的一个手段而已，它本质上还是要为用户提供良好的，稳定的，高效的，安全的服务，所以需要对相关的资源使用相应的手段进行管理。这是操作系统的目的和手段。

由上文的操作系统的结构图我们可以知道，操作系统里面有进程管理以及各种管理，那么操作系统管理进程的时候，肯定是允许多进程存在的，比如：

这些，都是进程，想看你的电脑里面存在哪些进程，你只需要esc + shift + ctrl打开任务管理器即可，所以现在可以证明，进程是可以存在多个的。

那么，什么是进程呢？

这里提问，如果将某个工程的数据和代码加载到内存里面，代码是否会跑起来呢？当然是不会的，因为cpu并没有从里面读取数据，当代码跑起来的时候，就存在了一个进程，难道进程是对应的，已经跑起来的程序吗？当然不是，这是不废话，进程 = PCB + 自己的代码和数据。

那么什么是PCB呢？这就有意思了，类比硬件，操作系统管理硬件的时候，需要硬件的信息，从而构建一个链表，再对链表的相关信息增删查改，从而实现管理硬件，那么必然存在一个结构体吧？因为只有结构体可以用来存储多个不同的数据类型。

从而，推理出PCB是对应数据集合的结构体，那么PCB的全称是：process control block 。也就是进程控制块，这就有意思了，进程控制块？不就是结构体吗，那为什么取个进程控制块呢？就是因为操作系统可以直接对PCB进行修改删除等操作，达到对进程控制的效果。

得出结论：进程 = PCB + 自己的代码和数据。

那么为什么要有PCB的概念呢？

因为：先描述再组织！

所以可以在内存块里面，多个进程之间以链表的形式进行连接，每个PCB里面都有下一个PCB的指针，那么操作系统可就轻松了，原本那么多不着头脑的进程，这下可以直接通过管理链表来实现管理进程了。

那么具体的PCB的名字是什么呢？是task_struct。

叫做task是因为外国人认为这是个任务嘛，所以就取名为task了。

进程都是动态运行的，我们如何理解动态运行这个概念呢？

是这样的，在内存块里面，OS占有一席之地，在里面实现对各种软硬件的管理，现在不同的进程进来了，总得有个先后队列吧？

所以存在task_queue的东西，也就是进程队列，不同的进程需要排队的，动态实际上就是多个PCB排队的过程。

具体的会放在后面介绍。

现在再来谈谈task_struct的内部属性：

首先认识一个点，我们不管是运行指令也好，运行自己编写的代码也好，本质上都是直接创建一个进程，不过指令是一瞬间就运行完成的，我们看不到相关的东西而已，那么什么进程那么多，我们如何区分不同的进程呢？像学校那样，我们每个人都有自己独一无二的学号，进程是同理的，存在一个东西叫做pid，即process id，进程的id，类比学生的学号即可。

说了那么多，我们应该如何看到pid呢？

在此之前，我们应该回想上篇文章介绍的系统调用接口：

我们知道系统调用是操作系统给我们的函数，我们目前从未调用过它，现在，就是调用我们人生中第一个系统调用接口的时候了，我们使用man手册查询可知：

从手册的说明书我们就知道2号接口是系统库函数调用，也就是我们即将学习的getpid：

cpp 复制代码

  1 #include <stdio.h>
  2 #include <sys/types.h>
  3 #include <unistd.h>
  4 
  5 int main()
  6 {
  7   printf("I am a process\nMy pid is %d\n",getpid());                                                                                                                                                          
  8   return 0;
  9 }

有意思的还有getpid()函数居然需要两个头文件一起才能使用。

欸，打印结果也是正常，打印的进程id每次都是不一样的，我们的初步目的已经达成了，但是进程肯定是不止就这么点东西的，所以我们应该输入ps -xaj 来看，这里先记着，xaj的顺序无所谓：

cpp 复制代码

  1 #include <stdio.h>
  2 #include <sys/types.h>
  3 #include <unistd.h>
  4 
  5 int main()
  6 {
  7   while(1)
  8   {
  9   printf("I am a process\nMy pid is %d\n",getpid());
 10   sleep(1);
 11   }                                                                                                
 12   return 0;
 13 }

首先改一下代码，死循环方便我们观察：

我们使用管道来筛选出包含test的进程，前两个我们是可以理解的，但是为什么grep也有呢？因为ps -xaj打开了进程，通过管道筛选，筛选也是一个进程，那么我们想要不看它，就可以：

grep -v grep反向筛选出不含grep的即可：

当然了，直接ps -xaj就相当于windows里面的任务管理器，查看所有进程。

我们可以看到，打印出来的pid是14191，在打印出来的head -1中也有pid，也是14191，所以pid打印出来是没问题的。

现在我们再来查看，ppid是个什么东西？ppid全程就是parent process id，也就是父进程的id，有人就有问题了，父进程？这个东西还带有继承的？我们是可以在一个进程中创建多个进程的，用到的函数是fork():

这里有个很有意思很有意思的点，会颠覆你的编程三观的，即这个返回值pid_t，类型本质上是unsigned int，这里就先留个伏笔。

我们先来看一段有意思的代码：

cpp 复制代码

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{ 
    printf("I am a father process!\n");
    fork();
    printf("I am a child process\n");
    return 0;
}

试问这段代码的运行结果是什么？

直接看结果：

可以发现打印了两遍第二次的printf，我们可以这样理解，我是一个公司老板，我在没有招员工之前一直再做相同的事，找了员工之后，员工和我做相同的事，但是我之前做的所以工作员工还需要做吗？不需要，所以第一行的printf是不会执行的，父进程原本的代码就是要执行printf的，所以会打印两次child process。

cpp 复制代码

  7   while(1)
  8   {
  9     printf("This is parent process:%d\nThis is child process：%d\n",getppid(),getpid());
 10     sleep(1);                                                                                      
 11   }

打印出来，对应的父进程的id是22252，子进程id是22239，在ppid 和 pid 下面也得到了验证。

更多的请看后面！！！

感谢阅读！