【Linux探索学习】第十二弹——初识进程:进程的定义、描述和一些简单的相关操作

Linux学习笔记:

https://blog.csdn.net/2301_80220607/category_12805278.html?spm=1001.2014.3001.5482

前言:

在前面经过那么多篇的铺垫后,今天我们正式进入Linux学习的第一个重难点------进程,理解进程对于我们学习操作系统的其它部分,尤其是多文件处理和资源管理十分重要,下面我们正式进入进程的第一篇讲解

目录

一、进程概念

二、进程描述

三、查看进程

四、通过系统调用获取进程标识符

五、通过系统调用创建进程------初识fork

六、总结


一、进程概念

进程是一个正在执行的程序的实例。它不仅包括程序的代码,还包括程序的当前活动、寄存器、程序计数器、堆栈及其所有与执行相关的资源。简单来说,进程是一个程序在运行时的一个动态实体。

需要注意的一点是进程的程序是一定被加载在内存中的,因为进程是系统将要进行处理的数据,而CPU是从内存中获取数据的,所以说进程的程序一定被加载在内存中的,比如我们vim写的一个.c的C语言程序,它在操作系统下的本质就是一个文件,是存放在外设中的,当运行起来时,我们就会将它的相关数据存放到内存中去,以便于CPU直接获取

二、进程描述

一个操作系统可能可以同时进行多个进程,比如我们可以让多个程序同时进行,我们的电脑可以同时跑多个软件,为了避免进程执行起来互相干扰,所以我们要对进程进行管理

一般进行管理的过程就是:先描述+再组织

所以我们要进行进程描述:任何一个进程,在被加载到内存,形成真正的进程时,操作系统都要先创建描述进程的结构体对象------PCB,也叫做进程控制块,可以理解为进程属性的集合,操作系统是C语言写的,所以PCB一定是一个struct结构体,PCB中会包含进程如下的重要信息:

  • 进程ID(PID):唯一标识一个进程的编号。
  • 进程状态:当前进程的状态。
  • 程序计数器:指向当前执行指令的地址。
  • CPU寄存器:进程在执行时的寄存器内容。
  • 内存管理信息:如页表和段表。
  • 进程优先级:调度时的优先级信息。

此外为了方便管理进程,处理进程与进程之间的关系,进程在内存中是以队列的形式存在的,具体点来讲就是链表(双链表),进程在内存中的存在形式可以抽象为下图:

由于PCB中包含着进程的所有信息,所以对进程管理的本质其实就是对进程的PCB做管理,进程在操作系统又通过队列进行链接,所以对进程的管理,其实就是对链表的增删改查

这里的PCB是针对所有操作系统而言的,在我们的Linux中我们往往习惯称呼这个概念为task struct

三、查看进程

在上面我们讲到进程的许多属性,包括进程编号、进程状态等等许多内容

首先我们可以通过查看/proc/文件,来查看我们目前正在执行的全部进程

cpp 复制代码
ls /proc/

这些数字就是进程的PID,每个进程都会有一个对应的PID,PID就是我们上面所说的进程ID,也叫做进程标识符,我们可以通过这些进程标识符来查看每个进程具体的信息,比如查看1号进程

cpp 复制代码
ls /proc/1

除了上面的这个方法外,我们还可以通过下面这个指令,不仅可以看到所有的进程,还可以看到它们的进程的属性信息:

cpp 复制代码
ps axj

我们节选一部分:

执行结果的第一行就是我们的进程属性信息的列名,下面就是每个进程对应的属性信息,我们可以只打印出一行来看一下进程属性的内容(需要借助之前的知识:管道 | 和打印行数head)

cpp 复制代码
ps axj | head -1

对于这些属性信息中,我们先记住前两个就行了,PPID指的是父进程标识符,PID知道是当前进程标识符

目前我们自己创建的可执行文件有test

我们可以查看下我们自己创建的这个进程的相关信息(注意只有当我们的程序在跑着的时候它才叫进程,所以我们可以将我们的程序写成一个死循环,然后让它执行起来)

cpp 复制代码
ps axj | head -1 && ps axj | grep test

观察这个执行结果,我们可以发现有两个相关进程,会出现第二条的原因就是执行查找test进程的命令本身也会成为一个进程,而这个进程中含test,所以会把自身也带上

如果不想要,可以在后面加上 | grep -v grep,这个-v选项我们在前面讲指令的时候是讲过的,是反向匹配的意思

cpp 复制代码
ps axj | head -1 && ps axj | grep test | grep -v grep

四、通过系统调用获取进程标识符

除了上面获取进程标识符的方法外,我们还可以通过系统调用的方式来获取表示符,系统接口为getpid和getppid,我们可以通过man手册来查看这个接口

cpp 复制代码
man 2 getpid

具体方法如下:

cpp 复制代码
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
 printf("pid: %d\n", getpid());
 printf("ppid: %d\n", getppid());
 return 0;
}

多次执行这个程序,我们会发现pid一直在变化,而ppid一直不变,也就是说子进程编号一直在变化,而父进程一直没变,为什么会出现这个现象呢?

这是因为,我们在打开Linux时,会首先创建一个bash进程,形成对话框,这个bash进程也是其它所有进程的子进程,所以一般代码重新运行时,它的子进程编号会变,而父进程编号不会变


我们可以创建一个监视窗口方便观察(了解):

cpp 复制代码
while :; do ps axj | head -1 ; ps axj | grep test | grep -v grep; 
echo "----------------------------"; sleep 1 ; done

五、通过系统调用创建进程------初识fork

我们可以通过fork手动创建进程,我们可以通过man手册查看一下fork

cpp 复制代码
man fork

我们先来看下面的一个小程序:

cpp 复制代码
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
     printf("before test");
     fork();
     printf("after test");
     return 0;
}

运行结果:

我们注意到在fork()函数之后的第二行打印语句执行了两次,说明在fork()之后一个进程变成了两个进程

此外,fork函数还有一个重要知识就是它是有两个整形返回值的,这点与我们之前所学的C语言中的函数差别很大,因为我们之前所学的函数都是只有一个返回值,fork的两个整形返回值中,大于0代表父进程,等于0是子进程

我们下面来看这样一个程序来验证一下:

cpp 复制代码
  1 #include<stdio.h>
  2 #include<sys/types.h>
  3 #include<unistd.h>
  4  
  5 int main()
  6 {
  7     pid_t id=fork();
  8     if(id>0)
  9     {
 10         //父进程
 11         printf("I am parent process, pid:%d, ppid:%d\n",getpid(),getppid());
 12     }
 13     else if(id==0)
 14     {
 15         //子进程
 16         printf("I am child process, pid:%d, ppid:%d\n",getpid(),getppid());
 17     }
 18     printf("hello linux\n");
 19     return 0;
 20 }

在这个函数中我们尝试将父子进程分开,并且在最后有一个公共代码区,执行结果:

我们可以看到子进程的ppid就是父进程的pid,所以也印证了它们的父子关系,而且最后一个打印代码父子进程都执行了

相信不少同学对上面的问题已经有了很大的疑惑了,比如fork为什么要给子进程返回0,给父进程返回子进程pid呢?其实这就是为了区分父子进程,让不同的执行流执行不同的代码

一般而言fork之后的代码是共享的,这也就是为什么上面的 "hello linux" 打印了两遍的原因,因为父子进程都执行了它,那么如果此时子进程对共享数据进行操作了,我们就需要对额外操作的数据开辟新空间,这就是写时拷贝,这我们会在后面详细讲解

至于为何pid_t id中的id可以取两个值,这也需要我们后面讲到进程空间地址的问题时再提,现在只需要也简单地理解为写时拷贝就可以了

六、总结

以上就是今天讲解的进程的基础内容,篇幅较长,文字较多,相信认真看完的你会有所收获,后面我们就将开启进程知识的深度讲解


感谢各位大佬观看,创作不易,还请各位大佬点赞支持!!!

相关推荐
zkf01000072 分钟前
ISAAC SIM踩坑记录--ROS2相机影像发布
linux
fivestar20091 小时前
一台服务器最大能打开的文件数
运维·服务器
看山还是山,看水还是。1 小时前
Oracle的字符串函数
运维·数据库·安全·oracle
很楠不爱1 小时前
Linux网络——自定义协议与序列化
linux·服务器·网络
姝孟2 小时前
LInux——环境基础开发工具使用(正在更新中...)
linux·运维·centos
Genius Kim2 小时前
Knife4j调试全局对象参数自动化
运维·python·自动化
大耳朵土土垚2 小时前
【Linux】ELF可执行程序和动态库加载
linux·运维·服务器
188_djh2 小时前
# 如何查看 Ubuntu 版本?
linux·ubuntu·lsb_release·/etc/issue·/proc/version·uname -r·查看ubuntu版本
Chervin2 小时前
Windows,虚拟机Ubuntu和开发板三者之间的NFS服务器搭建
linux·单片机·ubuntu·arm
ac.char2 小时前
在 Ubuntu 上安装 Redis 并为其设置登录密码
linux·redis·ubuntu