Linux信号（下）：信号保存和信号处理

文章目录

信号保存（阻塞信号）

阻塞信号相关常见概念

信号递达（Delivery）：实际执行信号的处理动作
信号未决（Pending）：信号从产生到递达之间的状态
进程可以选择阻塞（Block）某个信号
被阻塞的信号产生时将保持在未决状态，直到信号对此信号的阻塞，才执行递达的动作

注意：阻塞和忽略是不同的，只要信号被主色就不会递达，而忽略是在递达之后可以选择的一种处理动作。

在内核中的表示

信号在内核中的表示示意图：

注释：图中SIG_DEL和SIG_IGN分别为默认动作和忽略动作的定义

每个信号都有两个标志位分别表示阻塞（block）和未决（pending），还有一个函数指针表示处理动作。信号产生时，内核在进程控制块中设置该信号的未决标志，直到信号递达后才清除该标志。
在上图中，SIGHUP信号未阻塞也未产生过，当它递达时执行默认处理动作。
SIGINT信号产生过，但正在被阻塞，所以暂时不能递达。虽然它的处理动作是忽略，但在没有解除阻塞之前不能忽略这个信号，因为进程仍有机会改变处理动作后再解除阻塞。
SIGQUIT信号未产生过，一旦产生SIGQUIT信号将会被阻塞，它的处理动作是用户自定义的函数sighander。
如果在进程解除对某种信号的阻塞之前这种信号产生过多次，将如何处理呢？
POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的：普通信号在递达之前产生多次只记一次 ，而实时信号在递达之前产生多次可以依次放在一个队列里面（本文不讨论实时信号）。

注意：

在block位图中，比特位的位置表示某一个信号，比特位的内容表示该信号是否被阻塞。
在pending位图中，比特位的位置也表示某一个信号，比特位的内容表示进程是否收到该信号
hander表本质上是一个函数指针数组，数组的下标表示某一个信号，数组的内容表示该信号抵达时的处理动作，动作包括默认、忽略和自定义。
这也侧面说明了系统提供的默认和忽略动作本质上是一个函数
block、pending和hander这三张表的每一个位置都是一一对应的。

可以看看默认动作SIG_DEL和忽略动作SIG_IGN的定义：

cpp 复制代码

/* Type of a signal handler.  */
typedef void (*__sighandler_t) (int);

/* Fake signal functions.  */
#define SIG_ERR	((__sighandler_t) -1)		/* Error return.  */
#define SIG_DFL	((__sighandler_t) 0)		/* Default action.  */
#define SIG_IGN	((__sighandler_t) 1)		/* Ignore signal.  */

默认动作就是将0强转为函数指针类型，忽略动作则是将1强转为函数指针类型，除此之外，还有一个错误 SIG_ERR表示执行动作为出错

sigset_t信号集

根据信号在内核中的表示方法，每个信号的未决标志只有一个比特位，非0即1，如果不记录该信号产生了多少次，那么阻塞标志也只有一个比特位。

因此，未决和阻塞标志可以用相同的数据类型sigset_t来存储。确保了不同平台中位图操作的兼容性。

sigset_t是将信号操作所需要的位图封装成了一个结构体类型。

在我们的云服务器中，sigset_t类型的定义如下：

cpp 复制代码

#define _SIGSET_NWORDS (1024 / (8 * sizeof (unsigned long int)))
typedef struct
{
	unsigned long int __val[_SIGSET_NWORDS];
} __sigset_t;

typedef __sigset_t sigset_t;

可以看到，其中是一个无符号长整型数组 。
_SIGSET_NWORDS 大小为 32，所以这是一个可以包含 32 个无符号长整型的数组，而每个无符号长整型大小为 4 字节，即 32 比特，所以至多可以使用1024 个比特位。

sigset_t称为信号集，这个类型可以表示每个信号的"有效"和"无效"状态。

在阻塞信号集中"有效"和"无效"的含义是该信号是否被阻塞。
在未决信号集中"有效"和"无效"的含义是该信号是否处于未决状态。

注意：阻塞信号集也叫做当前进程的信号屏蔽字（Signal Mask），这里的"屏蔽"应该理解为阻塞，而不是忽略。

信号集操作函数

关于sigset_t类型内部如何存储这些比特位是依赖于操作系统的实现的，我们从使用者的角度不必关心，使用者只能调用以下函数来操作sigset_ t变量，而不应该对它的内部数据做任何解释，比如用printf直接打印sigset_t变量是没有意义的。

cpp 复制代码

#include <signal.h>

int sigemptyset(sigset_t *set);	//初始化信号集
int sigfillset(sigset_t *set);	//初识化信号集
int sigaddset(sigset_t *set, int signum);	//增
int sigdelset(sigset_t *set, int signum);	//删
int sigismember(const sigset_t *set, int signum);	//查

各个操作函数解释：

sigemptyset：初始化set所指向的信号集，将该信号集所有bit清零，表示该信号集不包含任何有效信号。
sigfillset：初始化set所指向的信号集，将该信号集所有bit置1，表示该信号集的有效信号包括系统支持的所有信号。
sigaddset：在set所指向的信号集中添加某种有效信号。
sigdelset：在set所指向的信号集中删除某种有效信号。
sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0，出错返回-1。
sigismember：判断在set所指向的信号集中是否包含某种信号，若包含则返回1，不包含则返回0，调用失败返回-1。

注意：在创建信号集sigset_t之后，一定要用sigemptyset或sigfillset函数初始化，确保信号集处于确定状态。

sigprocmask函数

sigprocmask函数可以用于读取或更改 进程的信号屏蔽字（block）

函数原型：

cpp 复制代码

#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);

函数剖析：

参数1how ：对信号屏蔽字的操作

假设进程当前的信号屏蔽字为mask，如下表说明了该参数的可选值及其含义：

选项	含义
SIG_BLOCK	set包含的是我们希望添加到当前信号屏蔽字的信号，相当于mask \|= set
SIG_UNBLOCK	set包含的是我们希望从当前信号屏蔽字解除的信号，相当于mask \|= ~set
SIG_SETMASK	设置当前信号屏蔽字为set所指向的值，先调用mask = set

参数2set ：一个信号集，主要从该信号集获取屏蔽信号信息
参数3oldset：输出型参数，也是一个信号集，保存进程中原来的block表（相当于调用该函数操作后，有反悔的机会）

返回值：若成功返回0，失败返回-1

注：如果调用sigprocmask解除了对当前若干个未决信号的阻塞，则在sigprocmask函数返回前，至少将其中一个信号递达。

sigpending

sigpending函数可以用于读取进程的未决信号集

函数原型：

cpp 复制代码

#include <signal.h>

int sigpending(sigset_t *set);

sigpending函数读取当前进程的未决信号集，通过set参数传出。调用成功则返回0,出错则返回-1。

信号处理

信号处理的时机

我们知道，信号产生后，可能并不会立即处理。

信号处理可能的时机有如下几种：

信号没有被阻塞，且进程没有重要的事情在做，信号产生后，记录未决信息后，再进行处理
信号没有被阻塞，但进程有重要的事情 正在做，信号产生后，信号不会被立即递达，而是在合适的时机再递达，进行信号处理
信号被阻塞了，信号产生后，不会被处理，直到阻塞被解除了，然后信号会递达，进行信号处理

合适的时机 ：进程从内核态 返回到用户态的时候，进行信号的检测和处理。

内核态和用户态

概念如下：

用户态：执行用户所写的代码时，就属于是用户态，是一种受监管的普通状态。
内核态：执行操作系统的代码时，就属于是内核态，是一种权限非常高的状态

操作系统的代码是什么？？？

操作系统也是软件，是软件就也是程序

操作系统在对进程进行调度、执行系统调用接口、异常、中断等等，本质上就是在执行操作系统的代码。

内核态和用户态之间是进行如何切换的？

试想，我们自己写的代码，常常会去调用库函数，而库函数的内部核心是由系统调用接口实现的，更何况我们学习操作系统时经常还自己调用系统调用接口。因此，CPU在执行代码的过程中，用户态与内核态这两种状态，必然会频繁的相互转换。

用户态切换为内核态的常见情况：
- 当进程时间片到了之后，进行进程切换的动作
- 调用系统调用接口时
- 产生异常、中断、陷阱......时
内核态切换为用户态的常见情况：
- 进程切换完毕后，运行相应的进程
- 系统调用结束后
- 异常、中断、陷阱......处理完毕时

其中，由用户态切换为内核态称为陷入内核。每当我们需要陷入内核时，本质上是因为我们需要去执行操作系统的代码，比如进行调用系统调用，就必须先由用户态切换为内核态。

重谈进程地址空间（三）

这是我们第三次谈进程地址空间：

一谈：Linux进程概念（下）：进程地址空间
二谈：Linux进程地址空间二谈：动态库加载原理揭秘

在进程地址空间中，存在1GB的内核空间（32位平台下），该空间存储的就是操作系统的相关代码和数据。

这块区域采用内核级页表与物理地址映射，并且没有MMU或类似的硬件配合地址转化，因为操作系统相关的代码和数据的虚拟地址和物理地址是固定的，对于虚拟地址，它固定在进程地址空间的顶部；对于物理地址，它固定在物理内存的底层。因此现在较为新版本的操作系统甚至都没有内核级页表了，直接映射。

值得一提的是：

有几个进程，就有几个用户级页表，因为进程具有独立性。
整个系统中，只有一份内核级页表，所有进程共用一份，因为进程再怎么切换，3~4GB的空间内容是固定不变的。
进程视角：我们调用系统的方法，就是在我们自己的进程空间进行执行的。
OS视角：任何一个时刻，都有进程在执行，我们想执行操作系统的代码，就可以随时执行！
操作系统的本质：基于时钟中断的一个死循环。
普通进程由操作系统调度来推动运行，那操作系统运行也是一个进程（1号进程），那谁来推动操作系统？
在计算机硬件中，有一个时钟芯片，每隔一个很短的时间（纳秒级别），会向CPU发送时钟中断，推动操作系统的执行。

我们所谓的"执行操作系统的代码 "，就是在这1GB的内核空间执行。

当我们程序调用系统调用接口时，会"跑到内核空间 "中调用对应的函数。

而"跑到内核空间 "，就是陷入内核 这个动作，本质上是给CPU发送一条软件中断指令int 80陷入内核。

CPU在收到这个指令后，会修改某个寄存器中的标志（两个比特位）。

该标志：

00：表示当前为内核态。
11：表示当前为用户态。
01和10：暂不研究。

如图：

重谈进程地址空间总结：

所有进程的用户空间0~3GB是不一样的，每个进程都要有自己的用户级页表进行不同的映射
所有进程的内核空间3~4GB是一样的，每个进程都可以看到同一张内核级页表，从而进行统一的映射，看到同一个操作系统
操作系统运行的本质其实就是在该进程的内核空间内运行的，但最终映射的都是同一块物理内存
系统调用的本质其实就是在用户空间跳转到内核空间的地址进行函数调用。

信号的处理过程

当在内核态完成某种任务后，需要切回用户态，此时就是对信号进行检测并处理的时机。

如果此时进程没有信号可抵达

处理完重要的事情后，直接切回用户态

信号处理过程图如下：

可能情况：信号被阻塞或没有信号产生

如果此时进程有信号可抵达

这种情况需要讨论信号的处理动作：

当前信号的处理动作为忽略或默认
信号处理过程图如下：
当前信号的处理动作为自定义捕捉
因为该信号的处理动作是由用户提供的，所以处理该信号时就需要先返回到用户态执行对应的自定义捕捉动作，执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位，如果没有新的信号可以递达的话，就直接返回用户态，继续执行主控制流的代码。
信号处理过程图如下：

注意：sighander和main函数使用的是不同的栈堆空间，是两个独立的控制流，它们之间不存在调用和被调用的关系。

一张图巧记信号处理过程：

该图形与直线有几个交点就代表在这期间有几次状态切换，而箭头的方向就代表着此次状态切换的方向，图形中间的圆点就代表着检查pending表。

sigaction函数

捕捉信号除了用前面用过的signal函数之外，我们还可以使用sigaction函数对信号进行捕捉，它的功能比signal函数更丰富

函数原型：

cpp 复制代码

#include <signal.h>

int sigaction(int signum, const struct sigaction *act,
                     struct sigaction *oldact);

struct sigaction 
{
	void     (*sa_handler)(int);	//自定义动作
	void     (*sa_sigaction)(int, siginfo_t *, void *);	//实时信号相关，不用管
	sigset_t   sa_mask;	//待屏蔽的信号集
	int        sa_flags;	//一些选项，不用管
	void     (*sa_restorer)(void);	//实时信号相关，不用管
};

返回值：函数调用成功返回0，出错返回-1。

参数解析：

参数1：待操作的信号
参数2：sigaction结构体，具体成员如上所示
参数3：输出型参数，保存修改前原来进程的sigaction结构体信息（提供反悔的机会）

对于sigaction结构体，我们只需要关心(*sa_handler)(int)和sa_mask这两个成员即可，其他成员暂时不要管。

该函数的核心功能：

如果进程正在处理一个2号信号，此时如果又产生一个2号信号，会并发处理吗？

答案是不会！如果进程在处理某个信号，此时进程会自动屏蔽该信号。

如果我们还想屏蔽更多其他的信号呢？

这个函数可以实现：
sigaction函数可以修改指定信号的处理动作（自定义信号处理动作），同时还可以提前设置一份信号屏蔽字，当执行signum中的用户自定义动作时，这些屏蔽信号字中的信号将会被屏蔽（避免干扰用户自定义动作的执行），直到用户自定义动作执行完成

信号拓展知识

可重入函数

下面主函数中调用insert头插函数向带头单向链表插入node1，某个信号处理函数中也调用了insert头插函数插入node2，乍一看感觉没啥问题。

其实是大有问题的，下面画图分析一下：

起初：
main函数中调用了insert函数，想将结点node1插入链表，但是insert操作分为两步，刚做完第一步的时候，可能会因为硬件中断使得进程切换到内核态，等再次回到用户态之前会检查是否有信号要去处理，因此又可能会切换到sighander函数。

而sighander函数中也调用了insert函数，将节点node2插入到了链表中
当节点node2插入的两步操作都做完之后从sighandler返回到内核态

此时链表的布局如下：
再次回到用户态就从main函数调用的insert函数中继续往下执行，即继续进行结点node1的插入操作。

此时链表的布局如下：

最终结果是，main函数和sighandler函数先后向链表中插入了两个结点，但最后只有node1结点真正插入到了链表中，而node2结点就再也找不到了，造成了内存泄漏。

总流程图如下：

像上例这样，insert函数被不同的控制流调用（main函数和sighandler函数使用不同的堆栈空间，它们之间不存在调用与被调用的关系，是两个独立的控制流程），有可能在第一次调用还没返回时就再次进入该函数 ，我们将这种现象称之为重入。

而insert函数访问一个全局链表，有可能因为重入而造成错乱，像这样的函数我们称之为不可重入函数 ，反之，如果一个函数只访问自己的局部变量或参数，则称之为可重入（Reentrant）函数。

如果一个函数符合以下条件之一则是不可重入的:

调用了malloc或free函数，因为malloc也是用全局链表来管理堆的。
调用了标准IO的库函数，因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

volatile关键字

volatile关键字的作用是：防止编译器过度优化，保持内存的可见性

在下面的代码中，我们对2号信号进行了捕捉，当该进程收到2号信号时会将全局变量flag由0置1。也就是说，在进程收到2号信号之前，该进程会一直处于死循环状态，直到收到2号信号时将flag置1才能够正常退出。

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

using namespace std;

int flag = 1;

void hander(int signo)
{
    cout << "catch signal success, signo:" << signo << endl;
    flag = 0;
}

int main()
{
    signal(2, hander);
    while(flag)
    {}//故意不写
    cout << "process quit" << endl;
    return 0;
}

运行结果在意料之中，我们再提高编译器的编译的优化等级试试（添加编译优化选项-O1、-O2、-O3，优化等级递增），我们试着将优化级别提升至O1：

原来，因为编译器的优化，编译器发现main主控制流除了在while中对flag有判断，没有其他地方用到flag了（也就是说编译器认为flag的值将是不会被修改的），所以编译器直接将内存中的flag拷贝一份副本到CPU寄存器中了，从此以后，while循环判断只拿该副本进行判断。

不巧的是，另一个控制流竟然会去修改这个flag了，但此时CPU却不会再去看内存中的flag了。造成了一个现象：因为编译器优化，导致我们的内存不见了。

面对这种情况，我们就可以使用volatile关键字对flag变量进行修饰，告知编译器，对flag变量的任何操作都必须真实的在内存中进行，即保持了内存的可见性。

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

using namespace std;

volatile int flag = 1;

void hander(int signo)
{
    cout << "catch signal success, signo:" << signo << endl;
    flag = 0;
}

int main()
{
    signal(2, hander);
    while(flag)
    {}//故意不写
    cout << "process quit" << endl;
    return 0;
}

提一嘴 ：不同版本的编译器优化程度差异很大，比如我的版本：

我的版本优化级别调到O2时，连空的死循环都被优化掉了（实验差点翻车哈哈~）。我想，在未来编译器的优化程度会越来越高，届时我们的程序会越来越快，但学习成本会相应提高。

SIGCHLD信号

为了避免出现僵尸进程，父进程需要使用wait或waitpid函数等待子进程结束，父进程可以阻塞等待子进程结束，也可以非阻塞地查询的是否有子进程结束等待清理，即轮询的方式。采用第一种方式，父进程阻塞就不能处理自己的工作了；采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。

其实，子进程在终止时会给父进程发生SIGCHLD信号，该信号的默认处理动作是忽略，父进程可以自定义SIGCHLD信号的处理动作，这样父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时会通知父进程，父进程在信号处理函数中调用wait或waitpid函数清理子进程即可。

等待一个子进程固然简单，但如果是10个子进程呢？如果有多个子进程同时退出呢？

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <signal.h>
#include <sys/types.h>
#include <sys/wait.h>

using namespace std;

void handler(int signo)
{
    sleep(1);
    pid_t rid;
    while ((rid = waitpid(-1, nullptr, WNOHANG)) > 0)
    {
        cout << "I am proccess: " << getpid() << " catch a signo: " << signo << "child process quit: " << rid << endl;
    }
}

int main()
{
    signal(17, hander); 

    for (int i = 0; i < 10; i++)
    {
        pid_t id = fork();
        if (id == 0)
        {
            while (true)
            {
                cout << "I am child process: " << getpid() << ", ppid: " << getppid() << endl;
                sleep(1);
                break;
            }
            cout << "child quit!!!" << endl;
            exit(0);
        }
        sleep(1);
    }
    // father
    while (true)
    {
        cout << "I am father process: " << getpid() << endl;
        sleep(1);
    }

    return 0;
}

需要注意的是：

SIGCHLD属于普通信号，记录该信号的pending位只有一个，如果在同一时刻有多个子进程同时退出，那么在handler函数当中实际上只清理了一个子进程，因此在使用waitpid函数清理子进程时需要可以使用while不断进行清理。
使用waitpid函数时，需要设置WNOHANG选项，即非阻塞式等待，然后判断函数返回值是否大于0即可。
这样，如果一次性有多个子进程退出，也能应对了。

此时父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时父进程收到SIGCHLD信号，会自动进行该信号的自定义处理动作，进而对子进程进行清理。

其实，由于UNIX的历史原因，要想不产生僵尸进程还有另外一种办法：父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN，这样fork出来的子进程在终止时会自动清理掉，不会产生僵尸进程，也不会通知父进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的，但这是一个特列。此方法对于Linux可用，但不保证在其他UNIX系统上都可用。

例如，下面代码中调用signal函数将SIGCHLD信号的处理动作自定义为忽略，看看是否会出现僵尸进程。

cpp 复制代码

int main()
{
    //signal(17, SIG_IGN); // SIG_DFL -> action -> IGN
    for (int i = 0; i < 10; i++)
    {
        pid_t id = fork();
        if (id == 0)
        {
            while (true)
            {
                cout << "I am child process: " << getpid() << ", ppid: " << getppid() << endl;
                sleep(1);
                break;
            }
            cout << "child quit!!!" << endl;
            exit(0);
        }
        sleep(1);
    }
    // father
    while (true)
    {
        cout << "I am father process: " << getpid() << endl;
        sleep(1);
    }

    return 0;
}

结果的确没有僵尸进程，说明子进程都被清理了。