对进程状态之间转换感到头疼,只听书本概念根本无法理解,死记硬背不是什么好的解决方法。只有进行底层操作去了解每一个进程状态,才能彻底弄清楚进程状态是如何转换的。
一、进程的各个状态
我们先从Linux内核数据结构来看:
每一个进程都是有其task_struct和它的代码和数据组成的,进程的状态被定义在task_struct里面,是其中的一条属性,进程状态改变修改这条属性就可以了。
在Linux内核里,这些状态被定义在一个数组里:
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态(在 Linux内核里,进程有时候也叫做任务)。
- R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里。
- S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠 (interruptible sleep))。
- T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可 以通过发送 SIGCONT 信号让进程继续运行。
- D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的 进程通常会等待IO的结束。
- X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。
1、R运行状态
我们写以下代码:
死循环,方便我们时刻查看进程的状态
左边查看进程的状态,右边执行可执行程序
在状态栏里,我们能够看出,此时进程的状态是R+-运行状态 ,这里的+表示在前台运行
这个比较容易理解。
2、S睡眠状态
2.1进程等待资源就绪
我们打开刚刚写的代码,在while循环里加上一个printf接口,打印我们的进程PID
接着,我们再在左边打开我们的查看进程状态的窗口,右边执行可执行程序
但是这次进程的状态,不再是R运行状态,而是S睡眠状态。
这里的原因是,这次的代码中有打印接口,会将打印的数据打印到我们的显示器上,但是CPU运算速率很快,而将打印数据传输到我们的显示器上的速度比较慢,和CPU的运算速率不在一个层次上,所以在很大一段时间内,CPU都在等待数据传输到显示器上,等待过程中,就是进程的睡眠状态。所以这时候会显示进程睡眠状态。
显示器是外设,也就是外设资源,所以呢,我们把这种情况叫做:进程等待资源就绪
2.2可中断睡眠
我们修改代码,再让他打印前先睡10s
前10s,进程没有打印数据,但仍然是睡眠状态
这时我们可以ctrl+c终止进程
ctrl之后,进程退出,睡眠状态结束。
所以我们把这种状态又叫可中断睡眠
3、T/t停止状态
写出以下代码:
我们运行并查看进程状态:
这时候是睡眠状态,屏幕中仍在打印着。
那我们有没有办法把它暂停,我们可以指令kill -19使其暂停,使用之前,我们先来看看kill 都有哪些指令:
指令有很多,现在只用了解三个,有我们常用的kill -9杀死进程指令,也有我们接下来要用到的,kill -18 唤醒进程,kill -19 暂停进程 。
我们用kill -19 指令暂停进程 可以看到,进程状态由S变为了T。
再使用kill -18 唤醒进程
进程状态又由T变成了S。
4、D磁盘休眠状态
先描述一个场景:内存中有一个进程,我现在要把这个进程中的一部分数据存到磁盘当中,大小为1GB,这个**数据很重要。**在传输时,该进程状态会设置成睡眠状态S.但是在传输的过程中,内存空间严重不足了。
操作系统管理着所有进程,在内存严重不足的时候,我们的操作系统有权利对进程进行杀死来释放空间,操作系统此时看到这个进程在睡觉,直接把它杀死了。那数据没有传输完成,结果导致这么重要的数据丢失了。那拿谁问责呢?
所以为了防止这个问题产生,就出现了D磁盘休眠状态,也被称为不可中断睡眠!
无法被中断,也无法被杀死,只能等他操作完成后自己醒来,或者强制重启电脑
二、僵尸进程和孤儿进程
1、僵尸进程
1.1概念
在子进程退出时,它的退出信息会保存在它的tast_struct里等待着父进程读取,被父进程读取之后,才会被操作系统回收。
僵尸进程就是子进程退出之后,它的退出信息并没有被父进程读取,从而处于失效状态,没有被回收。
1.2僵尸进程带来的问题
我们知道,进程=task_struct+进程的代码和数据,当子进程退出之后,它的代码和数据不会再被使用,已经被释放掉,但是它的task_struct会一直都在,必须等待操作系统读取。task_struct会一值占用小段内存,这就会造成内存泄漏,使得这小段内存再也无法使用。
1.3演示
写一段以下代码:
在前五秒的时候,我们的子进程会跟父进程一起打印,五秒后,子进程退出,父进程依然打印,从左边状态可以看出,我们的子进程状态退出后状态变成了Z:僵尸状态
这就是因为我们的子进程退出之后,父进程依然在打印,没有时间去读取子进程的退出信息,从而使它变成了僵尸进程。
那为什么我们在写单进程代码时,不会出现这种情况呢?因为单进程的父进程是bash,
bash是什么,bash可以理解为最顶端的父进程,bash会自动回收Z状态进程。
2、孤儿进程
孤儿进程是在我们子进程没有退出之前,其父进程先退出,父亲不见了,其就变成了孤儿,此时他也面临着无法回收问题,但是它一般会被一号进程(OS本身)领养,由一号进程再把它回收。
我们修改一下代码,让父进程先退出:
此时子进程将称为孤儿
可以看到由前台S+状态变成了后台S状态
至于如何回收,我们下篇文章再谈。
三、运行、阻塞、挂起
接下来我们重点来说一下这三种状态的概念和相互转换
1、运行
在我们的操作系统中,进程一般都在进程队列里,新建一个进程就是将这个进程的task_struct和其代码和数据放到这个进程队列里,再通过链表链接起来。
操作系统想要调度进程,前提是CPU需要去维护一个运行队列,我们想要运行进程,那么就要把这个进程放在运行队列里,这样操作系统就调度进程使,让CPU从运行队列里调度就可以了。
这时存在于运行队列里的进程都是运行状态。严谨点来说,存在于运行队列里的都是就绪态,被调用时才是运行态
2、阻塞
先描述一个场景,当我们写代码时,用到scanf函数,进程在等待我们键盘输入的这个过程,是如何等待的呢?
scanf函数等待我们的硬件-键盘输入,也是需要操作系统进行管理的,我们前篇已经讲过,操作系统对硬件管理时,也是用到内核数据结构,将所有硬件的属性和信息放到一个结构体里,用链表的形式链接。
我们要明确一个概念,进程在等待键盘输入**,既然是等待,那么他就不是在运行**,不是运行态就不会在运行队列里,那么它会在哪里呢?
在设备的等待队列 里,此时设备的结构体中会有一个等待队列,来存放等待设备响应的进程。当进程在等待键盘输入时,这个进程的task_struct会被放入这个设备的等待队列里,这时候就变成了阻塞态
接着我们的键盘输入后,该进程task_struct又会被放入运行队列,这一操作被称为唤醒状态又会变成运行态,此时我们的CPU就可以获取我们输入的数据了
3、挂起
当我们处于阻塞态时,进程都在等待硬件响应,等待的这段时间里,它占用内存但是不会去做什么实际的事。不断的累计会造成内存吃紧,当内存吃紧的时候,我们就需要一种方式去缓解内存压力
在我们的磁盘里,有一个叫做swap分区,用来存放内存里的一些数据,当我们内存吃紧的时候,我们可以把处于阻塞态的进程的代码和数据暂存到磁盘中的swap分区里,这样就会腾出可观的空间,缓解内存压力。这时进程的状态就被称为挂起。
由内存到swap分区这一操作被称为唤出,由swap分区到内存这一操作被称为唤入。
频繁唤入唤出会不会有什么后果呢?
当操作系统感觉到压力大的时候,会把一些数据暂存到swap分区,如果我们的swap分区较大,那么操作系统每次感觉到压力大的时候,都会把一些数据暂存到swap分区,在swap分区的数据多了,那么电脑的效率必然会降低,因为每次都需要把数据唤入到内存。
所以,频繁的唤入唤出会导致系统效率降低,我们可以把swap分区空间设置的不要太大,从而让操作系统合理的使用swap分区。