Linux深度探索：进程管理与系统架构

1.冯诺依曼体系结构

我们常见的计算机，如笔记本。我们不常见的计算机，如服务器，大部分都遵守冯诺依曼体系。

截至目前，我们所认识的计算机，都是由⼀个个的硬件组件组成。

输入设备：键盘，鼠标，话筒，摄像头，...，网卡，磁盘
输出设备：显示器，磁盘，网卡，打印机，...
中央处理器（CPU）：含有运算器和控制器等
我们把输入输出设备称为外设。
磁盘（硬盘）：外存

关于冯诺依曼，必须强调几点 ：

这里的存储器指的是内存；
不考虑缓存情况，这里的CPU能且只能对内存进行读写，不能访问外设（输入或输出设备）；
外设(输入或输出设备)要输入或者输出数据，也只能写入内存或者从内存中读取。
一句话，所有设备都只能直接和内存打交道。

在学习C++进行文件操作时，读文件操作本质是把磁盘中的数据读取到内存中，写文件则是将内存里的数据写入对应的磁盘上，这类数据的读写动作被称为Input/Output（IO）。
从硬件层面来说，站在内存的角度理解IO，当外部设备将数据传输给内存时，这一过程称为Input（输入），而当内存把数据传输给输出设备时，这一过程就叫做Output（输出）。

1.我们编译好的软件，它要运行必须先加载到内存？那程序运行之前在哪里？

在磁盘，因为我们今天知道，程序就是个文件，它就是我们编译好的，在我们磁盘特定路径下的一个二进制文件。

2.为什么我们对应的程序，运行的时候必须得从我们对应的磁盘加载到我们内存呢？

程序运行与内存加载：编译好的软件以二进制文件形式存于磁盘特定路径下，要运行必须先加载到内存。因为在计算机体系结构里，软件运行由CPU执行代码、访问数据，但CPU只能读写内存数据，无法直接读取外设数据，所以程序需从磁盘（外设）加载到内存，该加载过程本质是Input，即把外设数据输入到存储器。
printf 执行原理：当程序在内存中运行并执行printf代码时，数据不会直接打印到输出设备，而是先存放在缓冲区，待需要时再刷新到外设。这同样是冯·诺依曼体系结构的规定，printf在CPU中执行代码，不能直接输出到外设。
数据流动与体系结构效率：数据流动本质是从一个设备"拷贝"到另一个设备。冯·诺依曼体系结构的效率由设备的"拷贝"效率决定。并且在数据层面，CPU只与内存打交道，外设也只与内存打交道。

3.冯诺依曼为什么是这种结构呢？计算机能否不使用内存，仅通过输入设备、CPU和输出设备运行?

存储分级与特点：计算机中有多种存储设备，如离CPU近的寄存器有存储能力，内存离CPU较近，磁盘离CPU较远。离CPU越远存储容量越大、效率越低但价格便宜，如4GB内存几百块，而同等价格可买约800T磁盘。
效率差异问题：输入输出设备作为外设运算效率低（如磁盘为毫秒级），CPU运算速度快（纳米级），两者效率相差10⁶倍。若没有内存，外设与CPU、输出设备交互时，会因速度不匹配导致整个体系结构效率由外设决定（木桶原理）。

设想将所有存储设备都换成寄存器可行，但会使计算机造价昂贵。

内存的作用及意义：为平衡效率和价格，计算机体系结构引入内存。内存可适配CPU和外设间的速度不匹配，使计算机既能以较低成本制造，又能有不错的运行效率，当代计算机是性价比的产物。

4.为什么冯诺依曼体系结构从上个世纪五六十年代到现在，基本上是我们当代计算机的主流结构？

主流结构原因：冯·诺依曼体系结构的历史意义在于让用户能用较低价格买到效率不错的计算机。随着芯片技术、摩尔定律推动存储技术发展，计算机变得更便宜且效率更高。如今以内存决定计算机效率，使普通人能买得起计算机，进而造就众多网民和互联网，该体系是构建互联网的必要条件。

5.那为什么我们有了内存之后效率就高了呢？木桶定律里里面最短的依然是输入输出设备呀？

内存提升效率原理：虽按木桶定律输入输出设备仍是短板，但后来出现的操作系统加载于内存中，它能用算法提前将外设数据搬到内存，配合局部性原理，让CPU可直接读取内存数据，从而使内存发挥最大效果提升效率。
后续内容预告：后续将讨论操作系统在该体系结构中扮演的角色和意义。

6.理解数据流动

举个场景，你在北京，你的朋友在南京，今天你两在QQ进行聊天，当你们两个聊天的时候，请帮我解释一下，今天你通过键盘输入了一个"你好"，那么"你好"这个字符串信息是如何展现在你朋友的显示器上的？如果是在qq上发送⽂件呢？

QQ聊天数据流动：双方用电脑QQ聊天，本质是两台冯·诺依曼体系设备交互。输入方打开并登录QQ，将QQ可执行程序加载到内存，通过键盘输入信息，数据从键盘（输入设备）流入内存（存储器）。QQ对信息加密，经运算器运算、CPU处理后写回内存，再通过网卡（输出设备）发送到网络。接收方网卡（输入设备）获取数据存入内存，启动的QQ读取数据交CPU解密，再写回内存并刷新到显示器（外设）显示。
QQ发送文件数据流动：文件本质是数据，拖拽文件到QQ程序时，文件从磁盘拷贝到内存，QQ执行代码加密、封包后写回内存，再刷新到网卡发送。对方网卡接收文件数据存入内存，解包、解密后写回内存，甚至打开目标文件，将数据写入磁盘（输出设备）。

总结：聊天是数据从用户键盘经体系结构转发到对方显示器的过程；发送文件是文件从本地磁盘经体系结构拷贝至对方磁盘的过程，软件的作用在于处理存储器和内存之间的关系，数据流动本质是在冯·诺依曼体系中进行。

2.操作系统统(Operator System)

2-1概念

任何计算机系统都包含一个基本的程序集合，称为操作系统（OS）。操作系统包括：

内核（进程管理，内存管理，文件管理，驱动管理）
其他程序（例如函数库，shell程序等等）

安卓系统基于Linux内核构建，负责管理手机硬件资源（CPU、内存、存储等），其本质仍遵循冯·诺依曼架构。与传统PC不同，手机通过触摸屏实现输入输出的高度集成，交互界面需专门设计。为此，安卓在Linux内核之上新增了应用框架层（如图形界面、API库等），开发者可基于此开发移动应用。

对比Windows：

安卓采用分层架构，图形界面运行于用户空间，与内核解耦；
Windows部分图形驱动与内核深度耦合（如DirectX），但因系统闭源，具体细节未知。

2-2设计OS的目的：

向下，与硬件交互，管理所有的软硬件资源（不是目的，是手段）
对上，为用户程序（应用程序）提供一个良好的执行环境（用户是目的）

1.软硬件体系结构层状结构；

2.访问操作系统，必须使用系统调用------其实就是函数，只不过是系统提供的；

printf的本质：是你把你的数据写到了硬件（显示器）！

3.我们的程序，只要你判断出它访问了硬件，那么它就必须贯穿整个软硬件体系结构；

4.库可能在底层封装了系统调用。

2-3核心功能

在整个计算机软硬件架构中，操作系统的定位是：⼀款纯正的"搞管理"的软件。

2-4理解操作系统的"管理"

如何理解"管理"，我们下面举个例子。

• 管理的例子------学生，辅导员，校长

• 要管理的对象：学生

• 进行管理的对象：校长

做这件事情，管理者校长有决策权，辅导员进行执行，去管理学生。

在这里，操作系统= 校长，底层硬件=学生，驱动程序=辅导员

1.要管理，管理者和被管理者，可以不需要见面

2.管理者和被管理者，怎么管理呢？根据"数据"进行管理！

3.不需要见面，如何得到数据？由中间层获取！

校长管理学生，可以转化为对Excel表格的数据的管理！

要是学生越来越多了，那校长的负担越来越大，而这项工作的本质其实是对数据进行增删查改。

"校长"了解一点编程语言，它只会c语言------因为它是一个操作系统，操作系统是用C语言写的。

日常的校长管理学生的工作，转化为对链表的增删查改！（其他数据结构也可）

这个建模的过程称为**先描述，再组织！**

对任何"管理"场景进行建模都适用！

总结计算机管理硬件：

描述起来，用struct结构体
组织起来，用链表或其他高效的数据结构

（类：解决先描述的问题；STL：解决的是再组织的问题。）

2-5理解系统调用

系统调用与库函数的关系：库函数和系统调用处于上下层关系。从开发层面看，操作系统对外呈现为一个整体，并暴露部分接口，即系统调用。系统调用功能基础，对用户要求较高。开发者可对部分系统调用进行适度封装形成库，方便上层用户或开发者进行二次开发。
操作系统的服务：操作系统需向上层提供服务。像printf打印是将字符串写到显示器硬件，scanf读入是从键盘读取硬件数据到软件程序，这些操作都需要操作系统参与，操作系统提供的访问硬件的能力就是服务。同时，操作系统不信任任何用户或人。
系统调用的本质：系统调用本质上是操作系统提供的函数调用。用户要访问操作系统获取数据、设置信息等都需通过系统调用完成。由于Linux、Windows、macOS等操作系统基本由C语言编写，所以提供的系统调用一般是C风格的C函数。函数有输入参数（用户提供给操作系统）和返回值（操作系统反馈给用户），系统调用本质是用户与操作系统之间的数据交互。

承上启下：我们启动的软件都会被加载到内存，因为冯诺依曼规定它必须得加载进来，在内存当中，当我们还没有启动软件的时候，还有一款软件在最开始就加载进来了，叫做操作系统(OS)。

OS必然要对多个被加载到内存中的程序进行管理，采取"先描述，再组织"的办法。

3.进程

3-1基本概念与基本操作

进程的组成：进程由内核数据结构对象和自身的代码与数据构成。

3-2描述进程------PCB

基本概念

进程信息被放在⼀个叫做进程控制块的数据结构中，可以理解为进程属性的集合。
课本上称之为PCB（process control block），Linux操作系统下的PCB是: task_struct

task_struct-PCB的⼀种

在Linux中描述进程的结构体叫做task_struct。
task_struct是Linux内核的⼀种数据结构，它会被装载到RAM(内存)⾥并且包含着进程的信息。

对进程理解的误区：

很多人错误地认为将程序和代码加载到内存中就是进程。实际上，进程加载时，除了将代码和数据加载到内存，操作系统还会在内部为其创建对应的task_struct结构体，该结构体可找到对应的代码和数据。并且所有的task_struct在操作系统内常以链表形式被管理起来，因此操作系统对进程的管理最终转化为对进程链表的增删查改。

创建PCB的原因：

操作系统为加载的进程创建对应的PCB（task_struct）结构体对象，是因为要管理进程。而管理进程必须先进行描述再组织，所以需要有描述进程的task_struct，之后通过特定数据结构（如链表）进行组织管理，这样操作系统对进程的管理就转变为对数据结构的增删查改操作。

3-3task_struct

内容分类：

组织进程

可以在内核源代码里找到它。所有运行在系统里的进程都以task_struct链表的形式存在内核里。

3-4查看进程

我们历史上执行的所有的指令、工具、自己的程序，运行起来，全部都是进程。

进程一旦启动，我们可以使用ps来查所有进程axj，a表示所有。
top也可以查所有进程。

如果我们只想看到我们自己刚启动的进程，可以用下面的命令：

在Linux中我们想同时执行两条命令可以用分号相隔。分号可以用&&代替，效果相同。

当我们去查进程的时候，对应的这个grep选项它总是会被显示出来，为什么呢？

bash 复制代码

8993 11868 11867  8993 pts/1    11867 S+       0   0:00 grep --color=auto myprocess

因为整条命令从左向右查的时候，grep也是个命令，当它最终要把你对应的查显示出来的结果做过滤的时候，grep命令一旦跑起来自己也是个进程，而它自己的过滤关键字里面本来就包括myprocess，所有它也会自己把自己查出来。

要是我们不想要查到grep可以使用下面命令：

这样就只会查到只是包含./myprocess对应进程ID8807了.

我们也可以通过一个Linux当中的目录结构叫做proc目录，也就是可以通过文件的形式去查看进程：

bash 复制代码

ls /proc

在操作系统中，不仅能用 ls 等命令通过目录结构查看磁盘上的文件，还能以文件形式呈现内存相关数据，让用户动态查看。比如 /proc 是内存级文件系统，其数据都来自内存，与磁盘无关。由于 Linux 遵循"一切皆文件"的设计理念，在 Linux 的设计中，甚至每个进程都能转化为若干个文件。

3-5通过系统调用获取进程标示符

我们来学习第一个系统调用：getpid

c 复制代码

pid_t getpid(void);     //获取进程ID

pid在哪里？在你当前task_struct的标识符中。

所以我们调用getpid，本质是让操作系统把当前进程的，从PCB把我的pid给拷贝出来，让用户看到自己的ID是什么。

只要是一个进程，就必然有自己的ID信息，所有只要有ID,我们就能证明这是一个进程。

pid_t是系统提供的，不是C语言的double这些，但Linux也是由C语言写的，这pid_t虽然是个系统级的类型，但它其实就是个int。

cpp 复制代码

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
	printf("pid: %d\n", getpid());
	printf("ppid: %d\n", getppid());
	return 0;
}

3-6终止进程的方法

1.ctrl+c是杀掉进程的！

2.输入命令：kill -9 +PID值(-9是一个信号编号)

每一次启动同一个进程，pid的值不同是很正常的；

我们运行的所有的命令，在系统里都是进程。只不过ls运行特别快，一启动就退出；只不过top命令一启动不退出，需要手动q来退出。

在Linux系统里，我们用户是以进程的方式，来反问操作系统。把用户看做一名老师，操作系统是一名学生，老师给学生布置任务，让学生去完成，可以布置很多任务，所以我们一般把进程也叫任务。所以PCB在Linux里，它叫做task.

3-7查看一下pid24747当前目录里的所有属性

在这里面，我们来重点了解一下exe和cwd：

1.exe：进程对应的可执行文件的绝对路径+我的数据名

要是删掉这个路径，并不影响进程，因为你删掉的是磁盘上的文件，而进程启动时，这个程序的拷贝已经在内存了，所以删掉并不直接影响这个进程，当然后面可能会有影响，后面再说。这充分证明了，我们自己代码已经从磁盘拷贝到内存了，所以我这个进程还在运行。

但我们再查找一次，这个路径就开始闪烁变红：它告诉我们进程虽然还在，但他对应的可执行程序已经deleted。

cwd 即 current work dir （当前工作目录），会保存一个路径，该路径就是当前程序所在路径。

在 C 语言中使用 fopen 函数创建文件，如 fopen("/a/b/c/d.txt","w"); 或 fopen("d.txt","w"); 时，若 fopen 要新建文件，对于像 fopen("d.txt","w"); 这种不带完整路径的情况，文件会在当前进程的当前路径下创建。

什么叫做当前路径呢？也就是说为什么fopen新建一个不带路径的文件，它就在你的那个指定路径下新建这个文件呢？

所谓当前路径，是因为进程在启动时会记录下自身的当前路径。 fopen 是进程内部的代码，执行 fopen 时，传入文件名后， fopen 内部会获取当前的工作路径，并将指定的文件名拼接到该路径后面，所以新建的文件就在当前路径下了。

3-8如何更改路径

cpp 复制代码

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>

int main()
{
	chdir("/home/LD");
	fopen("hello.txt","a");
	while(1)
	{
			sleep(1);
			printf("我是一个进程！，我的pid：%d\n",getpid());
		}
}

在进程启动时，先把自己的当前路径改一下，改完之后再创建文件。

getppid

cpp 复制代码

pid_t getppid(void);//获取父进程ID

在Linux系统中，所有进程皆由其父进程创建，呈现单亲繁殖的特点，不存在"母进程"这一概念。每个子进程都由对应的父进程生成，并且一个父进程能够创建多个子进程。同时，父进程本身也有自己的父进程。基于这种进程间的创建关系，Linux中所有进程构成了类似树状的结构，故而也被称作进程树。

cpp 复制代码

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>

int main()
{
	while(1)
	{
			sleep(1);
			printf("我是一个进程！，我的pid：%d,我的父进程id：%d\n",getpid(),getppid());
		}
}

bash 复制代码

我是一个进程 ！,我的pid: 23421,我的父进程id: 21817
我是一个进程 ！,我的pid: 23421,我的父进程id: 21817
我是一个进程 ！,我的pid: 23421,我的父进程id: 21817
^C
[root@VM-8-2-centos lesson4]# ./myprocess
我是一个进程 ！,我的pid: 23590,我的父进程id: 21817
我是一个进程 ！,我的pid: 23590,我的父进程id: 21817
^C
[root@VM-8-2-centos lesson4]# ./myprocess
我是一个进程 ！,我的pid: 23611,我的父进程id: 21817
我是一个进程 ！,我的pid: 23611,我的父进程id: 21817
^C

我的pid每次启动都会变化，这是正常的，它是一个递增的一个值，其实你每次启动你的进程都是向系统里重新加载。

父进程ID是不变的？那父进程是谁呢？

bash 复制代码

[root@VM-8-2-centos ~]# ps ajx | head -1 && ps axj | grep 21817 | grep -v grep
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
21752 21817 21817 21817 pts/0    25397 Ss       0   0:00 -bash

我们查到的进程是一个bash，也就是说我自己的程序在启动时，每一次启动我的父进程都是bash，bash是什么呢？

bash------命令解释器！

1.命令行解释器（老板）：bash本质是一个进程！

2.老板和实习生！

知识点：我们每次登陆我们的云服务器时，操作系统会给每一个登录用户分配一个bash!

其中bash前的-，表示是远程登录的。

那么下面的一串是什么？

bash 复制代码

[root@VM-8-2-centos lesson4]#

这是bash打出来的一个字符串。

为什么光标就卡在那里不动了？

因为bash也是C语言写的，我们可以想到之前写printf,scanf的时候，一printf它就可以把字符串打印出来，一scanf它就卡在那里了，所以我们命令行输入的所有命令都是喂给了对应的bash，以字符串交给bash，bash拿到命令就可以做分析了。

一个进程比如bash，他是怎么做到可以创建一个子进程呢？

代码创建子进程的方式！

3-7通过系统调用创建进程------fork初识

man fork 认识fork
fork是一个系统调用，它的作用就是创建一个子进程。

fork有创建了一个进程，那么我们一会将看到，第二个printf将执行两次，但是打印的getpid()的值应该是不一样的，因为一个是父进程它自己，一个是新创建的子进程。

原理：进程=PCB(task struct)+自己的代码和数据！

创建子进程时，操作系统会为其创建一个进程控制块（PCB），本质是拷贝父进程的PCB 。父进程的PCB指向自身的代码和数据，子进程创建后，默认也指向父进程的代码和数据。由于此时没有新程序加载，子进程没有独立的代码和数据，会共享父进程的代码和数据，在被调度执行时，会执行父进程后续的代码。

我们执行下面命令来看一下fork的返回值：

bash 复制代码

man fork
/return val

所以fork会有两个返回值吗？？是的！！

我们要是想要父子进程未来执行不同得代码逻辑！要怎么办呢？

fork 之后通常要用 if 进行分流

fork 函数被调用后，系统会复制父进程的地址空间等资源来创建子进程，此时父子进程共享代码段。之所以会出现子进程返回值为0，父进程返回值大于0（子进程ID），进而进入不同执行流。

疑问：
1.为什么fork给父子返回各自的不同返回值？为什么给子进程返回0，给父进程返回子进程对应的pid？

主要原因是父：子=1：n。父进程可能有多个孩子，所以一定要把子进程的pid返回给父进程，因为父进程要通过不同的pid,来区分它不同的子进程，而子进程就不需要获得父进程的pid,因为它已经能获得getppid了。

2.为什么一个函数会返回两次？
一个函数运行到return XX了，它的核心功能已经做完了。
fork函数它本质是一个系统调用，它被调用时就会进入fork函数。在fork函数中，进行申请新的PCB，拷贝父PCB给子进程，子PCB放入进程list,甚至放入调度队列中！（这时子进程已经被创建，甚至被调度了！）。
之后执行return id; return 是语句吗？是的！所以实际上，在fork函数内部它在进行执行时，执行到return的时候就已经共享了，所以父进程会执行，子进程也会执行。所以return被返回两次。

3.为什么一个变量，即等于0，又大于0？导致if else同时成立?

关于变量看似矛盾的情况：不存在一个变量既等于0又大于0。在父子进程中，因进程独立性，父进程挂了不影响子进程正常运行。

父子进程的数据关系：父子进程间数据初始是共享的，当任何一方要修改数据时，操作系统采用写时拷贝技术，会在底层拷贝一份数据让目标进程修改，如子进程写数据时，父进程访问旧数据，子进程访问新拷贝的数据。
父子进程独立性的实现：
一是数据结构独立，因为数据与内存结构相关；
二是代码共享，数据通过写时拷贝方式各自私有一份，即父子进程代码共享，数据各自开辟空间私有。

之后的在虚拟地址空间展现讲。

图片上，子进程不管怎么改，父进程都是100.