目录
前言:
本文会开始慢慢切入进程了,当然,切入进程之前,我们需要再次复习一下操作系统,后面接着是介绍什么是进程,如何查看进程,在Linux中对应的文件是哪个等相关的问题,进程大概会持续更新多节,所以说进程的知识点还是相当杂乱的,就更需要同学们予以注意了。
有关进程的相关理解
首先,我们需要知道,为什么需要操作系统?
操作系统的工作是执行软硬件资源的管理,如何管理硬件上文提及的是通过驱动程序,使得硬件的相关数据组织成为一个链表,操作系统可以直接对链表的信息进行修改,驱动程序再对硬件实施管理,这是先描述再组织,从而实现了管理硬件,那么这是操作系统的一个手段,也就是管理硬件的一个手段而已,它本质上还是要为用户提供良好的,稳定的,高效的,安全的服务,所以需要对相关的资源使用相应的手段进行管理。这是操作系统的目的和手段。
由上文的操作系统的结构图我们可以知道,操作系统里面有进程管理以及各种管理,那么操作系统管理进程的时候,肯定是允许多进程存在的,比如:
这些,都是进程,想看你的电脑里面存在哪些进程,你只需要esc + shift + ctrl打开任务管理器即可,所以现在可以证明,进程是可以存在多个的。
那么,什么是进程呢?
这里提问,如果将某个工程的数据和代码加载到内存里面,代码是否会跑起来呢?当然是不会的,因为cpu并没有从里面读取数据,当代码跑起来的时候,就存在了一个进程,难道进程是对应的,已经跑起来的程序吗?当然不是,这是不废话,进程 = PCB + 自己的代码和数据。
那么什么是PCB呢?这就有意思了,类比硬件,操作系统管理硬件的时候,需要硬件的信息,从而构建一个链表,再对链表的相关信息增删查改,从而实现管理硬件,那么必然存在一个结构体吧?因为只有结构体可以用来存储多个不同的数据类型。
从而,推理出PCB是对应数据集合的结构体,那么PCB的全称是:process control block 。也就是进程控制块,这就有意思了,进程控制块?不就是结构体吗,那为什么取个进程控制块呢?就是因为操作系统可以直接对PCB进行修改删除等操作,达到对进程控制的效果。
得出结论:进程 = PCB + 自己的代码和数据。
那么为什么要有PCB的概念呢?
因为:先描述再组织!
所以可以在内存块里面,多个进程之间以链表的形式进行连接,每个PCB里面都有下一个PCB的指针,那么操作系统可就轻松了,原本那么多不着头脑的进程,这下可以直接通过管理链表来实现管理进程了。
那么具体的PCB的名字是什么呢?是task_struct。
叫做task是因为外国人认为这是个任务嘛,所以就取名为task了。
进程都是动态运行的,我们如何理解动态运行这个概念呢?
是这样的,在内存块里面,OS占有一席之地,在里面实现对各种软硬件的管理,现在不同的进程进来了,总得有个先后队列吧?
所以存在task_queue的东西,也就是进程队列,不同的进程需要排队的,动态实际上就是多个PCB排队的过程。
具体的会放在后面介绍。
现在再来谈谈task_struct的内部属性:
首先认识一个点,我们不管是运行指令也好,运行自己编写的代码也好,本质上都是直接创建一个进程,不过指令是一瞬间就运行完成的,我们看不到相关的东西而已,那么什么进程那么多,我们如何区分不同的进程呢?像学校那样,我们每个人都有自己独一无二的学号,进程是同理的,存在一个东西叫做pid,即process id,进程的id,类比学生的学号即可。
说了那么多,我们应该如何看到pid呢?
在此之前,我们应该回想上篇文章介绍的系统调用接口:
我们知道系统调用是操作系统给我们的函数,我们目前从未调用过它,现在,就是调用我们人生中第一个系统调用接口的时候了,我们使用man手册查询可知:
从手册的说明书我们就知道2号接口是系统库函数调用,也就是我们即将学习的getpid:
cpp
1 #include <stdio.h>
2 #include <sys/types.h>
3 #include <unistd.h>
4
5 int main()
6 {
7 printf("I am a process\nMy pid is %d\n",getpid());
8 return 0;
9 }
有意思的还有getpid()函数居然需要两个头文件一起才能使用。
欸,打印结果也是正常,打印的进程id每次都是不一样的,我们的初步目的已经达成了,但是进程肯定是不止就这么点东西的,所以我们应该输入ps -xaj 来看,这里先记着,xaj的顺序无所谓:
cpp
1 #include <stdio.h>
2 #include <sys/types.h>
3 #include <unistd.h>
4
5 int main()
6 {
7 while(1)
8 {
9 printf("I am a process\nMy pid is %d\n",getpid());
10 sleep(1);
11 }
12 return 0;
13 }
首先改一下代码,死循环方便我们观察:
我们使用管道来筛选出包含test的进程,前两个我们是可以理解的,但是为什么grep也有呢?因为ps -xaj打开了进程,通过管道筛选,筛选也是一个进程,那么我们想要不看它,就可以:
grep -v grep反向筛选出不含grep的即可:
当然了,直接ps -xaj就相当于windows里面的任务管理器,查看所有进程。
我们可以看到,打印出来的pid是14191,在打印出来的head -1中也有pid,也是14191,所以pid打印出来是没问题的。
现在我们再来查看,ppid是个什么东西?ppid全程就是parent process id,也就是父进程的id,有人就有问题了,父进程?这个东西还带有继承的?我们是可以在一个进程中创建多个进程的,用到的函数是fork():
这里有个很有意思很有意思的点,会颠覆你的编程三观的,即这个返回值pid_t,类型本质上是unsigned int,这里就先留个伏笔。
我们先来看一段有意思的代码:
cpp
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
printf("I am a father process!\n");
fork();
printf("I am a child process\n");
return 0;
}
试问这段代码的运行结果是什么?
直接看结果:
可以发现打印了两遍第二次的printf,我们可以这样理解,我是一个公司老板,我在没有招员工之前一直再做相同的事,找了员工之后,员工和我做相同的事,但是我之前做的所以工作员工还需要做吗?不需要,所以第一行的printf是不会执行的,父进程原本的代码就是要执行printf的,所以会打印两次child process。
cpp
7 while(1)
8 {
9 printf("This is parent process:%d\nThis is child process:%d\n",getppid(),getpid());
10 sleep(1);
11 }
打印出来,对应的父进程的id是22252,子进程id是22239,在ppid 和 pid 下面也得到了验证。
更多的请看后面!!!
感谢阅读!