《Linux从练气到飞升》No.17 进程创建

🕺作者：主页

我的专栏

C语言从0到1

探秘C++

数据结构从0到1

探秘Linux

菜鸟刷题集

😘欢迎关注：👍点赞🙌收藏✍️留言

🏇码字不易，你的👍点赞🙌收藏❤️关注对我真的很重要，有问题可在评论区提出，感谢阅读！！！

我的专栏
C语言从0到1
探秘C++
数据结构从0到1
探秘Linux
菜鸟刷题集

前言

前言

之前我们在进程基本概念中讲述过fork可以创建子进程（请在《探秘Linux》专栏中查看），但是我们只是大概讲述了一下它的功能和大致原理，算作是初识，本篇将更为详细的讲述它的用法------创建进程

fork函数

在linux中fork函数时非常重要的函数，它从已存在进程中创建一个新进程。新进程为子进程，而原进程为父进程。

在我们想要使用fork函数时，注意一下几点：

cs 复制代码

#include <unistd.h>//记得包头文件

pid_t fork(void);//fork函数的返回值是pid_t，注意转化（）

返回值：子进程中返回0，父进程返回子进程id，出错返回-1

进程调用fork函数以后，内核做了什么？

分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝至子进程
添加子进程到系统进程列表当中
fork返回，开始调度器调度

如下图：

当一个进程调用fork之后，就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以开始它们自己的旅程，我们来测试一下~

cpp 复制代码

#include <stdio.h>
#include <unistd.h>

int main( void )
{
    pid_t pid;
    printf("Before: pid is %d\n", getpid());
    if ( (pid=fork()) == -1 )perror("fork()"),exit(1);
    printf("After:pid is %d, fork return %d\n", getpid(), pid);
    sleep(1);
    return 0; 
}

运行结果：

这里看到了三行输出，

一行before，两行after。

进程4863先打印before消息，然后它有打印after。

另一个after消息有4864打印的。

注意到进程4864没有打印before，

为什么呢？如下图所示

所以，fork之前父进程独立执行，fork之后，父子两个执行流分别执行。注意，fork之后，谁先执行完全由调度器决定。

fork函数返回值

子进程返回0
父进程返回的是子进程的pid

写时拷贝

通常，父子代码共享，父子再不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自一份副本。具体见下图:

fork常规用法

**一个父进程希望复制自己，使父子进程同时执行不同的代码段。**例如，父进程等待客户端请求，生成子进程来处理请求。
**一个进程要执行一个不同的程序。**例如子进程从fork返回后，调用exec函数

fork调用失败的原因

系统中有太多的进程，进程太多，可能就没有多余的内存来创建进程了，进而导致fork调用失败。
实际用户的进程数超过了限制

fork面试题

请你描述一下folk创建子进程，操作系统都做了什么？

我们推一下，fork创建子进程，也就是说系统里多了一个进程。进程等于内核数据结构加进程代码和数据，而进程代码和数据一般从磁盘中来。也就是你的c或c++程序加载之后的结果。那么我们再倒退回去，folk创建子进程，操作系统就会从磁盘中加载c或c++程序加载之后的结果，然后同时创建内核数据结构，包括地址空间、页表等，进而形成一个新的进程。

fork之后子进程是否能够使用父进程的全部代码？

创建子进程，给子进程分配对应的内核结构。必须子进程自己独有了，这是因为进程具有独立性，理论上子进程要有自己的代码和数据。可是一般而言我们没有加载的过程，也就是说子进程没有自己的代码和数据，所以子进程只能使用父进程的代码数据。但是代码都是不可被写的，只能读取，所以父子共享没有问题，但是数据可能被修改的，所以必须分离。

但是我们还没有说到一个问题：子进程代码共享 。是否是所有的？还是只是说fork之后的?

实际上我们的代码汇编之后会有很多行代码，而且每行代码加载到内存之后都有对应的地址，因为进程随时可能被中断，可能并没有执行完就中断了，下次回来还必须从之前的位置继续运行。就要要求 CPU必须随时记录下当前进程执行的位置，所以CPU内有对应的寄存器，数据用来记录当前进程的执行位置。我们之前讲过，寄存器在CPU内只有一份，寄存器的数据是可有多份的 ，这个寄存器数据也就是进程的上下文 。那么这个进程的上下文数据要不要给子进程呢？答案是要的 ，虽然复制进程各自调的，各自会修改EIP（程序计数器），但是已经不重要了，因为子进程已经认为自己的EIP其实值就是fork之后的代码，它必须共享所有的代码。

操作系统为何要选择写时拷贝技术对父子进程进行分离？

总结起来是两点：

一、用的时候再给你分配，是高效使用内存的一种表现。

二、操作系统无法在代码执行前预知哪些空间会被访问？

展开谈谈：

试想一下，对于数据而言，创建进程的时候，就直接拷贝分离。是不是会浪费内存 ？可能拷贝子进程根本就不会用到的数据空间，即便是用到了，也可能只是读取，而我们创建子进程，不需要将不会被访问的或者只会读取的数据拷贝一份。

但是，什么数据值得拷贝呢？将来会被父或子进程写入的数据 。但是一般而言，即便是操作系统，也无法提前知道哪些空间可能会被泄露，而且就算提前拷贝了，也不一定会立马使用。所以操作系统选择了写时拷贝 技术来进行将父子进程的数据进行分离。写时拷贝是一种延迟申请技术 ，它可以提高整机内存的使用率 的同时也完成了进程独立性的技术保证。

后记

本篇我们较为详细的讲述了fork函数的使用，以及它的相关原理，请结合进程概念那篇博客一起食用~