🌟 各位看官好,我是!****
🌍 Linux == Linux is not Unix !
🚀 今天来学习Linux中进程概念与基本操作。
👍 如果觉得这篇文章有帮助,欢迎您一键三连,分享给更多人哦!
目录
粗略理解进程
我们说过在C/C++中可执行程序需要加载到内存当中,交给CPU进行执行。那么进程是指什么呢?
输出结论:进程 = 内核数据结构(PCB ...)+ 代码和数据。
在下图中,可执行程序加载到内存,此时操作系统会分配一个PCB指向加载的代码和数据 ,将PCB+代码和数据称为一个进程(实际上是内核数据结构,但虚拟地址空间、页表需后面学习)。
cpp
struct PCB
{
//包含进程的所有的属性信息
代码地址
数据地址
int pid
struct PCB *next; //实际是双链表进行连接
};

那么可以有多个程序加载到内存中吗?肯定可以。
势必意味着存在多个进程,那么操作系统要不要管理这些大量的进程呢?该如何管理这些进程呢?
先描述,再组织!!!
因此操作系统对进程的管理,就转成对链表的增删查改操作!
扩展:
- 每一个进程会以双链表的形式进行链接
- 这里的运行队列(runqueue)会链接该进程链表,执行进程
- 由于有多个进程,那么每一个进程就都要排队。因此进程排队,本质是让PCB结点进行排队。

进程概念
- 标示符: 描述本进程的唯⼀标示符,⽤来区别其他进程。
- 状态: 任务状态,退出代码,退出信号等。
- 优先级: 相对于其他进程的优先级。
- 程序计数器: 程序中即将被执⾏的下⼀条指令的地址。
- 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
- 上下⽂数据 : 进程执⾏时处理器的寄存器中的数据。
- I / O状态信息: 包括显⽰的I/O请求,分配给进程的I∕O设备和被进程使⽤的⽂件列表。
- 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
- ...
代码和数据加载到内存,操作系统创建一个PCB指向加载的代码和数据,将内核数据结构(PCB)+ 代码和数据 称为进程,这个进程需要被执行。而进程的执行会牵扯到进程状态、进程优先级、进程切换的问题,我们在后续章节一一展开。(这里浅浅认识下)
按照我们的理解一个进程不应该执行完再执行下一个进程吗?
而我们日常打开浏览器,wps,微信时,它们却能同时存在,这说明进程被执行的时候,并不是把这个进程执行完再下一个,而是要做切换、调度的!!!
但我由进程1切换到进程2时,后面我又要执行进程1时,就要重新执行,这显然不是我们所期望的。因此,在CPU中有一套寄存器(上下文数据),它会记录当时进程执行到的代码和数据,下一次轮到该进程被执行时,只需要做硬件上下文的保存和恢复,而不需要重新执行该进程!!!
CPU中有一个IR用来获取代码和数据,它通过PC(程序计数器)所指向的代码进行获取。

寄存器里的内容:

进程操作
查看进程
既然每一个进程都有自己的标示符,那么系统是否提供接口供我们查看进程所在标示符呢?
getpid用来获取当前进程的标示符,它是由操作系统提供的系统调用。
/proc系统文件夹查看
cpp
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
while(1)
{
printf("pid: %d\n", getpid());
}
return 0;
}

那么id为250128的进程里面的内容有什么呢?

可以看到进程里面的exe和cwd是什么呢?
exe不就是我们的可执行程序吗?这说明进程会记录自己对应的磁盘二进制可执行文件!
cwd为进程启动的时候,默认工作路径是自己可执行程序所处的路径,指向当前进程的工作路径。
而我们之前使用fopen库函数时,是在当前路径下进行打开。那么什么叫做当前路径呢?

ps工具获取

在上图中的PPID又是什么呢?它是当前进程的父进程,那么操作系统又是否提供了查看父进程标示符的系统调用呢?
getppid用来查看父进程的标示符
这里的bash不就是当时王婆婚介所的王婆吗?她通过派出自己婚介所的人员进行执行。

fork创建进程
Linux系统,增多进程,是通过父进程创建子进程的方式,让Linux系统中的进程变多的!!!
那么该如何创建子进程呢?
fork是由操作系统所提供的系统调用,用来创建子进程

fork返回值
可以看到fork是有返回值的,那么它的**返回值是用来做啥的呢?**如下所示

- 问题1:返回值为什么是这样的?成功创建,父进程返回子进程pid,子进程返回0
- 问题2:一个函数怎么会有两个返回值?
- 问题3:在我们的印象当中,一个变量不应该只有一个返回值吗?为什么这里一个变量可以返回一个大于0,又能返回等于0?需要学虚拟地址空间才能解惑,先晾在一边。
解惑问题1:
父进程创建子进程可以是1:n的关系,而父进程只能有1个,但子进程可以有多个。
因此父:子 = 1:n的关系。
而子进程要找到父进程的方式很容易,因为它是唯一的。但是父进程要找到子进程是不容易的,它需要拿到子进程的pid。
解惑问题2:
证明确实有两个返回值:

为什么有两个返回值:
在fork的内部在返回值之前就创建了子进程,此时父子分别执行不同的代码区域,从而实现让父子执行不同的任务!即父子可以返回各自有返回值,这是可以理解的。


