Linux 进程信号

你在网上买了很多件商品，再等待不同商品快递的到来。但即便快递没有到来，你也知道快递来临时，你该怎么处理快递。也就是你能"识别快递"
当快递员到了你楼下，你也收到快递到来的通知，但是你正在打游戏，需5min之后才能去取快递。那么在在这5min之内，你并没有下去去取快递，但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行，可以理解成"在合适的时候去取"。
在收到通知，再到你拿到快递期间，是有一个时间窗口的，在这段时间，你并没有拿到快递，但是你知道有一个快递已经来了。本质上是你"记住了有一个快递要去取"
当你时间合适，顺利拿到快递之后，就要开始处理快递了。而处理快递一般方式有三种：1. 执行默认动作（幸福的打开快递，使用商品）2. 执行自定义动作（快递是零食，你要送给你你的女朋友）3. 忽略快递（快递拿上来之后，扔掉床头，继续开一把游戏）
快递到来的整个过程，对你来讲是异步的，你不能准确断定快递员什么时候给你打电话

异步的理解

例如：老师准备上课，快走到教室时，突然忘了拿喝水的水瓶，于是老师让一个学生帮他去拿，在这个学生帮老师拿水瓶的途中，该老师并没有等该学生回来之后再讲课，而是讲课和拿水瓶同时进行，我们就可以称这个过程为异步

反之，若这个老师等这个学生回来之后在进行授课，那么我们称这个过程为同步

技术应用角度的信号

cpp 复制代码

#include <iostream>
#include <unistd.h>

int main()
{
    while(true)
    {
        std::cout << "I am process!!!" << std::endl;
        sleep(1);
    }

    return 0;
}

以上代码为死循环，在执行的过程中我们使用Ctrl + c使其进程终止

我们可以使用signal函数对2号信号进行捕捉，证明当我们按Ctrl+C时进程确实是收到了2号信号。

signal函数

signal原型如下：

cpp 复制代码

typedef void (*sighandler_t)(int);
sighandler_t signal(int signum, sighandler_t handler);

使用signal函数时，我们需要传入两个参数

第一个是需要捕捉的信号编号
第二个是对捕捉信号的处理方法，该处理方法的参数是int，返回值是void，实际上就是一个函数指针。

例如，下面的代码中将2号信号进行了捕捉，当该进程运行起来后，若该进程收到了2号信号就会打印出收到信号的信号编号。

cpp 复制代码

#include <iostream>
#include <unistd.h>

void handler(int signal)
{
    std::cout << "Successful capture signal" << signal  << ' ' << getpid() << std::endl;
}

int main()
{
    //捕获 Ctrl + c产生的2号信号
    signal(SIGINT, handler);

    while(true)
    {
        std::cout << "I am process!!!" << std::endl;
        sleep(1);
    }

    return 0;
}

此时当该进程收到2号信号后，就会执行我们给出的handler方法，而不会像之前一样直接退出了，因为此时我们已经将2号信号的处理方式由默认改为了自定义了。

由此也证明了，当我们按Ctrl+C时进程确实是收到了2号信号。

在Linux中只允许一个进程是前台进程，允许多个进程是后台进程

cpp 复制代码

#include <iostream>
#include <unistd.h>

int main()
{
    while(true)
    {
        std::cout << "I am process!!!" << std::endl;
        sleep(1);
    }

    return 0;
}

当我们允许test之后，再输入ls指令时系统不会给我们任何回应，因为此时bash已经变成了后台进程，获取不到键盘输入

我们可以在这个指令的最后加上&，让它运行之后直接变成后台进程，不要和bash抢占前台进程

可以发现现在我们使用ls指令bash就可以接收到了

注意：

Ctrl+C产生的信号只能发送给前台进程。在一个命令后面加个&就可以将其放到后台运行，这样Shell就不必等待进程结束就可以接收新的命令，启动新的进程。
Shell可以同时运行一个前台进程和任意多个后台进程，但是只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
前台进程在运行过程中，用户随时可能按下Ctrl+C而产生一个信号，也就是说该进程的用户空间代码执行到任何地方都可能收到SIGINT信号而终止，所以信号相对于进程的控制流程来说是异步的。

键盘文件是如何输入给内核的？Ctrl + c又是怎么变成信号的？

我们使用键盘输入数据到内存中时，它会检查你写入的是控制信号还是数据，若不是信号，进程会去键盘文件的文件页缓冲区读取数据，若是信号

用户输入控制信号然后触发硬件中断以充放电的形式让CPU记录下来，CPU来读取这个数据，此时CPU中就会形成一个中断号，操作系统就会识别这个中断号，然后去操作系统预先加载号的中断向量表中找到对应的方法进行执行，最后将数据从外设拷贝到内存中

信号概念

信号是进程之间事件异步通知的一种方式，属于软中断。

用kill -l命令可以察看系统定义的信号列表

其中1~31号信号是普通信号，34~64号信号是实时信号，普通信号和实时信号各自都有31个，每个信号都有一个编号和一个宏定义名称,这些宏定义可以在/usr/include/x86_64-linux-gnu/bits/signum-generic.h 中找到,例如其中有定义: #define SIGINT 2

信号是如何记录的？

实际上，当一个进程接收到某种信号后，该信号是被记录在该进程的进程控制块当中的。我们都知道进程控制块本质上就是一个结构体变量，而对于信号来说我们主要就是记录某种信号是否产生，因此，我们可以用一个32位的位图来记录信号是否产生。

其中比特位的位置代表信号的编号，而比特位的内容就代表是否收到对应信号，比如第6个比特位是1就表明收到了6号信号。

信号是如何产生的？

一个进程收到信号，本质就是该进程内的信号位图被修改了，也就是该进程的数据被修改了，而只有操作系统才有资格修改进程的数据，因为操作系统是进程的管理者。也就是说，信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图。

**注意：**信号只能由操作系统发送，但信号发送的方式有多种。

信号处理常见方式概览

可选的处理动作有以下三种：

忽略此信号。
执行该信号的默认处理动作。
提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号。

这些信号各自在什么条件下产生,默认的处理动作是什么,在signal(7)中都有详细说明: man 7 signal

bash 复制代码

man 7 signal

信号的产生

通过键盘组合键发送信号

以下代码除了使用Ctrl + c终止掉以外还可以使用Ctrl + \终止

cpp 复制代码

#include <iostream>
#include <unistd.h>

int main()
{
    while(true)
    {
        std::cout << "I am process!!!" << std::endl;
        sleep(1);
    }

    return 0;
}

Ctrl + c 和 Ctrl + \ 的区别是什么？

Ctrl + c 使用的是2号信号杀死进程而 Ctrl + \ 使用的是3号信号

我们捕获以下Ctrl + \的信号

cpp 复制代码

#include <iostream>
#include <unistd.h>

void handler(int signal)
{
    std::cout << "Successful capture signal Ctrl + \\: " << signal  << ' ' << getpid() << std::endl;
}

int main()
{
    //捕获 Ctrl + c产生的2号信号
    signal(SIGQUIT, handler);

    while(true)
    {
        std::cout << "I am process!!!" << std::endl;
        sleep(1);
    }

    return 0;
}

2号信号与3号信号有什么区别呢？

Term和Core都代表着终止进程，但是Core在终止进程的时候会进行一个动作，那就是核心转储。

什么是核心转储？

在云服务器中，核心转储是默认被关掉的，我们可以通过使用ulimit -a命令查看当前资源限制的设定。

其中，第一行显示core文件的大小为0，即表示核心转储是被关闭的。

我们可以通过ulimit -c size命令来设置core文件的大小。

core文件的大小设置完毕后，就相当于将核心转储功能打开了。此时如果我们再使用Ctrl+\对进程进行终止，就会发现终止进程后会显示core dumped

core文件的格式就是：core-出错的可执行程序-该进程pid-月份

注意：如果你打开了核心转储，出错时出现了core dump，但是并没有出现core文件

那可能是：core文件生成路径问题

解决方式如下：

在root用户下执行 echo "./core-%e-%p-%s" > /proc/sys/kernel/core_pattern来设置core文件的生成路径。退出root模式后，再次运行程序即可看到生成的core文件‌

说明一下： ulimit命令改变的是Shell进程的Resource Limit，但myproc进程的PCB是由Shell进程复制而来的，所以也具有和Shell进程相同的Resource Limit值。

核心转储的这个功能有什么用？

如果我们的代码运行结束了，那么我们可以通过退出码来判断代码出错的原因，而如果一个代码是在运行过程中出错的，那么我们也要有办法判断代码是什么原因出错的。

当我们的程序在运行过程中崩溃了，我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下，我们会用到核心转储，核心转储指的是操作系统在进程收到某些信号而终止运行时，将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中，这个磁盘文件也叫做核心转储文件，这个文件一般是以core开头

而核心转储的目的就是为了在调试时，方便问题的定位。

如何运用核心转储进行调试？

使用gdb对当前可执行程序进行调试，然后直接使用core-file core文件命令加载core文件，即可判断出该程序在终止时收到了3号信号，并且定位到了产生该错误的具体代码。

说明一下： 事后用调试器检查core文件以查清错误原因，这种调试方式叫做事后调试。

core dump标记

cpp 复制代码

pid_t waitpid(pid_t pid, int *status, int options);

waitpid函数的第二个参数status是一个输出型参数，用于获取子进程的退出状态。status是一个整型变量，但status不能简单的当作整型来看待，status的不同比特位所代表的信息不同，具体细节如下（只关注status低16位比特位）：

若进程是正常终止的，那么status的次低8位就表示进程的退出状态，即退出码。若进程是被信号所杀，那么status的低7位表示终止信号，而第8位比特位是core dump标志，即进程终止时是否进行了核心转储。

例如：我们使用fork函数创建子进程，执行代码故意设计一个野指针问题

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

int main()
{
    pid_t id = fork();
    if(id == 0)
    {
        printf("I am child!!!\n");
        int *p = nullptr;
        *p = 100;

        exit(0);
    }

    int stutas = 0;
    pid_t rid = waitpid(-1, &stutas, 0);
    printf("exitcode: %d, coredump: %d, signalkill: %d\n", 
        (stutas>>8)&0xFF, (stutas>>7)&1, stutas&0x7F);
    
    return 0;
}

可以看到，所获取的status的第7个比特位为1，即可说明子进程在被终止时进行了核心转储。

因此，core dump标志实际上就是用于表示程序崩溃的时候是否进行了核心转储。

除了Ctrl + c 和 Ctrl + \之外是否还有其他组合键

使用以下代码，将1到31号信号全部捕获

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <signal.h>

void myhandler(int signal)
{
    std::cout << "signal: " << signal << std::endl;
}

int main()
{
    for(int i = 1; i <= 31; ++i)
    {
        signal(i, myhandler);
    }

    while(true)
    {
        sleep(1);
    }
    
    return 0;
}

向前台进程发送Ctrl + c Ctrl + \ Ctrl + z组合键信号之后，我们就可以看到它们分别是几号信号了

但是有些信号是不可被捕获的，例如9号信号

**说明：**因为如果所有信号都能被捕捉的话，那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略，此时该进程将无法被杀死，即便是操作系统。

通过系统函数向进程发信号

kill函数

实际上kill命令是通过调用kill函数实现的，kill函数可以给指定的进程发送指定的信号，kill函数的函数原型如下：

cpp 复制代码

int kill(pid_t pid, int sig);

kill函数用于向进程ID为pid的进程发送sig号信号，如果信号发送成功，则返回0，否则返回-1。

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <sys/types.h>

int main(int argc, char *argv[])
{
    if(argc != 3) // ./mykill 9 进程pid
    {
        printf("%s\n", argv[0]);
        return 1;
    }

    int pid = atoi(argv[2]);
    int signal = atoi(argv[1]);

    kill(pid, signal);
 

    return 0;
}

为了让生成的可执行程序在执行时不用带上路径，我们可以将当前路径导入环境变量PATH当中。

此时我们便模拟实现了一个kill命令，该命令的使用方式为mykill 进程ID 信号编号

raise函数

raise函数发送指定信号给调用者，就是给当前进程发送信号，raise函数的函数原型如下：

cpp 复制代码

int raise(int sig);

raise函数用于给当前进程发送sig号信号，如果信号发送成功，则返回0，否则返回一个非零值。

例如，下列代码当中用raise函数每隔一秒向自己发送一个2号信号。

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

void myhandler(int signal)
{
    std::cout << "get a signal " << signal << std::endl;
}

int main()
{
    signal(SIGINT, myhandler);

    while(true)
    {
        sleep(1);
        raise(2);
    }

    return 0;
}

运行结果就是该进程每隔一秒收到一个2号信号。

raise实际上就是对kill的封装

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

void myhandler(int signal)
{
    std::cout << "get a signal " << signal << std::endl;
}

int main()
{
    signal(SIGINT, myhandler);

    while(true)
    {
        sleep(1);
        kill(getpid(), 2);  //将raise该为kill
    }

    return 0;
}

abort函数

raise函数可以给当前进程发送SIGABRT信号(6号信号)，使得当前进程异常终止，abort函数的函数原型如下：

cpp 复制代码

void abort(void);

abort函数是一个无参数无返回值的函数。

例如，下列代码当中每隔一秒向当前进程发送一个SIGABRT信号。

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

void myhandler(int signal)
{
    std::cout << "get a signal " << signal << std::endl;
}

int main()
{
    signal(SIGABRT, myhandler);

    while(true)
    {
        sleep(1);
        abort();
    }

    return 0;
}

虽然我们对SIGABRT信号进行了捕捉，并且在收到SIGABRT信号后执行了我们给出的自定义方法，但是当前进程依然是异常终止了。

说明一下： abort函数的作用是异常终止进程，exit函数的作用是正常终止进程，而abort本质是通过向当前进程发送SIGABRT信号而终止进程的，因此使用exit函数终止进程可能会失败，但使用abort函数终止进程总是成功的。

注意：如果6号信号被捕获，不使用abort函数是不会终止进程的

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

void myhandler(int signal)
{
    std::cout << "get a signal " << signal << std::endl;
}

int main()
{
    signal(SIGABRT, myhandler);

    while(true)
    {
        sleep(1);
        raise(6);
    }

    return 0;
}

6号进程被捕获之后，我们对自己使用6号进程，这时进程不会结束

由软件条件产生信号

SIGPIPE信号

SIGPIPE信号实际上就是一种由软件条件产生的信号，当进程在使用管道进行通信时，读端进程将读端关闭，而写端进程还在一直向管道写入数据，那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。

例如，下面代码当中，创建匿名管道进行父子进程之间的通信，其中父进程是读端进程，子进程是写端进程，但是一开始通信父进程就将读端关闭了，那么此时子进程在向管道写入数据时就会收到SIGPIPE信号，进而被终止。

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>

const int N = 2;

void slaver(int wfd)
{
    const char *str = "Hello Linux!!!\n";
    while(true)
    {
        ssize_t s = write(wfd, str, sizeof(str));
        if(s < 0)
        {
            perror("test.cpp::slaver::write");
            return;
        }
    }
}

int main()
{
    int pipefd[N];

    if(pipe(pipefd) < 0)
    {
        perror("test.cpp::main::pipe");
        return 1;
    }

    pid_t id = fork();
    if(id == 0)
    {
        close(pipefd[0]);
        slaver(pipefd[1]);
        close(pipefd[1]);
        
        exit(0);
    }

    close(pipefd[1]);
    printf("read quit!\n");
    close(pipefd[0]);

    int stutas = 0;
    waitpid(id, &stutas, 0);

    printf("Qiut signal: %d\n", stutas&0x7F);

    return 0;
}

运行代码后，即可发现子进程在退出时收到的是13号信号，即SIGPIPE信号。

SIGALRM信号

调用alarm函数可以设定一个闹钟，也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程，alarm函数的函数原型如下：

cpp 复制代码

unsigned int alarm(unsigned int seconds);

alarm函数的作用就是，让操作系统在seconds秒之后给当前进程发送SIGALRM信号，SIGALRM信号的默认处理动作是终止进程。

alarm函数的返回值：

若调用alarm函数前，进程已经设置了闹钟，则返回上一个闹钟时间的剩余时间，并且本次闹钟的设置会覆盖上一次闹钟的设置。
如果调用alarm函数前，进程没有设置闹钟，则返回值为0。

若调用alarm函数前，进程已经设置了闹钟，则返回上一个闹钟时间的剩余时间，并且本次闹钟的设置会覆盖上一次闹钟的设置。

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

void myhandler(int signal)
{
    std::cout << "...get a sig, number: " << signal << std::endl; 
    int n = alarm(5);
    std::cout << "剩余时间：" << n << std::endl;
}

int main()
{
    signal(SIGALRM, myhandler);
    int n = alarm(8);

    while(1)
    {
        std::cout << "proc is running..., pid: " << getpid() << std::endl;
        sleep(1);
    }

    return 0;
}

运行结果：

如果调用alarm函数前，进程没有设置闹钟，则返回值为0。

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <signal.h>

int main()
{
    signal(SIGALRM, myhandler);
    int n = alarm(6);
    std::cout << "剩余时间：" << n << std::endl;
    while(1)
    {
        std::cout << "proc is running..., pid: " << getpid() << std::endl;
        sleep(1);
    }

    return 0;
}

运行结果：

例如：每过2秒发送一个SIGALRM信号，循环打印

cpp 复制代码

#include <iostream>
#include <signal.h>
#include <unistd.h>

void myhandler(int signal)
{
    std::cout << "get a signal " << signal << std::endl;
    alarm(2); //每两秒打印该信号，一直刷新闹钟
}

int main()
{
    signal(SIGALRM, myhandler);

    int n = 0;
    alarm(2); //设置一个2秒的闹钟，发送SIGALRM信号
    while(true)
    {
        sleep(1);
        printf("I am process!!!\n");
    }

    return 0;
}

由硬件异常产生信号

为什么C/C++程序会崩溃？

当我们程序当中出现类似于除0、野指针、越界之类的错误时，为什么程序会崩溃？本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止，那操作系统是如何识别到一个进程触发了某种问题的呢？

我们知道，CPU当中有一堆的寄存器，当我们需要对两个数进行算术运算时，我们是先将这两个操作数分别放到两个寄存器当中，然后进行算术运算并把结果写回寄存器当中。此外，CPU当中还有一组寄存器叫做状态寄存器，它可以用来标记当前指令执行结果的各种状态信息，如有无进位、有无溢出等等。而操作系统是软硬件资源的管理者，在程序运行过程中，若操作系统发现CPU内的某个状态标志位被置位，而这次置位就是因为出现了某种除0错误而导致的，那么此时操作系统就会马上识别到当前是哪个进程导致的该错误，并将所识别到的硬件错误包装成信号发送给目标进程，本质就是操作系统去直接找到这个进程的task_struct，并向该进程的位图中写入8信号，写入8号信号后这个进程就会在合适的时候被终止。

其中页表属于一种软件映射关系，而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU，它是一种负责处理CPU的内存访问请求的计算机硬件，因此映射工作不是由CPU做的，而是由MMU做的，但现在MMU已经集成到CPU当中了。

当需要进行虚拟地址到物理地址的映射时，我们先将页表的左侧的虚拟地址导给CPU中存储虚拟地址的寄存器，在通过该寄存器将虚拟地址导入给MMU，然后MMU会计算出对应的物理地址，我们再通过这个物理地址进行相应的访问。而MMU既然是硬件单元，那么它当然也有相应的状态信息，当我们要访问不属于我们的虚拟地址时，MMU在进行虚拟地址到物理地址的转换时就会出现错误，然后将对应的错误写入到自己的状态信息当中，在CPU中也有专门存储转换失败虚拟地址的寄存器，CPU会将转换失败的虚拟地址放入到该寄存器上面，操作系统检查到之后，就会给对应的进程一直发送信号，例如像野指针发送的就是SIGSEGV。

总结一下：

C/C++程序会崩溃，是因为程序当中出现的各种错误最终一定会在硬件层面上有所表现，进而会被操作系统识别到，然后操作系统就会发送相应的信号将当前的进程终止。

信号的保存

阻塞信号

信号其他相关常见概念
实际执行信号的处理动作称为信号递达(Delivery)
信号从产生到递达之间的状态,称为信号未决(Pending)。
进程可以选择阻塞 (Block )某个信号。
被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

在内核中的表示

1到31号信号都有处理方法，在操作系统中由指针数组维护

在内核中，信号是由两张位图（block和pending）和hanler方法表来管理的

位图及方法表的介绍

block位图：为0表示阻塞，1表示不阻塞

pending位图：0表示已经处理完毕，为1表示信号未决

handle方法表（函数指针数组）：处理信号的默认方法例如：SIG_ING(忽略） SIG_DFL（改信号的默认方法）

每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过(已经抵达，并且完成了默认的方法),当它递达时执行默认处理动作。
SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。 SIGQUIT信号未产生过,一旦产生
SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理? POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的: 普通信号在递达之前产生多次只计一次（规定）,而实时信号在递达之前产生多次可以依次放在一个队列里。

sigset_t

sigset_t是一个位图类型，这个类型的产生，为了方便我们对pending表和block表进行操作

每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的"有效"或"无效"状态

在阻塞信号集中"有效"和"无效"的含义是该信号是否被阻塞
而在未决信号集中"有效"和"无效"的含义是该信号是否处于未决状态

阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的"屏蔽"应该理解为阻塞而不是忽略。

信号集操作函数

int sigemptyset(sigset_t *set); //清空信号集（清空位图）

int sigfillset(sigset_t *set); //将整个位图置1

int sigaddset (sigset_t *set, int signo); //添加特定的信号

int sigdelset(sigset_t *set, int signo); //删除一个特定的信号

int sigismember（const sigset_t *set, int signo); //判断信号是否在信号集中

详细解释：

sigemptyset函数：初始化set所指向的信号集，使其中所有信号的对应bit清零，表示该信号集不包含任何有效信号。
sigfillset函数：初始化set所指向的信号集，使其中所有信号的对应bit置位，表示该信号集的有效信号包括系统支持的所有信号。
sigaddset函数：在set所指向的信号集中添加某种有效信号。
sigdelset函数：在set所指向的信号集中删除某种有效信号。
sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0，出错返回-1。
sigismember函数：判断在set所指向的信号集中是否包含某种信号，若包含则返回1，不包含则返回0，调用失败返回-1。

注意： 在使用sigset_t类型的变量之前，一定要调用sigemptyset或sigfillset做初始化，使信号处于确定的状态。

cpp 复制代码

#include <stdio.h>
#include <signal.h>

int main()
{
	sigset_t s; //用户空间定义的变量

	sigemptyset(&s);

	sigfillset(&s);

	sigaddset(&s, SIGINT);

	sigdelset(&s, SIGINT);

	sigismember(&s, SIGINT);
	return 0;
}

注意： 代码中定义的sigset_t类型的变量s，与我们平常定义的变量一样都是在用户空间定义的变量，所以后面我们用信号集操作函数对变量s的操作实际上只是对用户空间的变量s做了修改，并不会影响进程的任何行为。因此，我们还需要通过系统调用接口，才能将变量s的数据设置进操作系统。

管理信号的函数

sigprocmask函数

**功能：**读取或者更改进程的信号屏蔽字（阻塞信号集），修改block表

函数原型如下：

cpp 复制代码

int sigprocmask(int how, const sigset_t *set, sigset_t *oset);

返回值:若成功则为0,若出错则为-1

如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。

sigprocmask函数的第一个参数 int how：

假设当前的信号屏蔽字为mask,下表说明了how参数的可选值：

**SIG_BLOCK：**set包含了我们希望添加到当前信号屏蔽字的信号，相当于mask=mask|set
**SIG_UNBLOCK：**set包含了我们希望从当前信号屏蔽字中解除阻塞的信号，相当于mask=mask|~set
**SIG_SETMASK：**设置当前信号屏蔽字为set所指向的值，相当于mask=set

解释一下： SIG_SETMASK 是指将set设置进内核的block表中，覆盖式的设置全新的对信号进行屏蔽的字段，就是重新设置
sigprocmask函数的第二个参数 const sigset_t *set:

根据第一个参数传入的指令，来修改block表中的数据
sigprocmask函数的第三个参数 sigset_t *oset：

保存被修改之前block表 //所有的保存都是为了恢复

sigpending函数

**功能：**将pending信号集中的数据以二进制的形式带出来

函数原型如下:

cpp 复制代码

int sigpending(sigset_t *set); //*set输出型参数，输出pending信号集

返回值:若成功则为0，若出错则为-1

我们来做一个小实验：

先用上述的函数将2号信号进行屏蔽（阻塞）。
使用kill命令或组合按键向进程发送2号信号。
此时2号信号会一直被阻塞，并一直处于pending（未决）状态。
使用sigpending函数获取当前进程的pending信号集进行验证。

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <signal.h>

using namespace std;

void PrintPending(const sigset_t* set)
{
    for(int i = 1; i < 31; i++)
    {
        if(sigismember(set, i) > 0)
        {
            cout << '1';
        }
        else
        {
            cout << '0';
        }
    }
    cout << endl << endl;
}


int main()
{
    //用户层操作
    sigset_t set, oset; //位图类型
    sigemptyset(&set); //初始化位图set，将位图全部bit位置为0
    sigemptyset(&oset);

    sigaddset(&set, SIGINT); //在位图中添加2号信号
    
    //调用系统接口将数据传入内核，内核操作
    int n = sigprocmask(SIG_SETMASK, &set, &oset); //使用新的位图，修改block表，对2号信号进行阻塞
    if(n < 0)
    {
        perror("main::sigprocmask");
        return 1;
    }

    sigset_t pending; 
    while(true)
    {
        sigpending(&pending);  //sigpending 系统调用接口 获取当前pending表
        PrintPending(&pending);
        sleep(1);
    }

    return 0;
}

可以看到，程序刚刚运行时，因为没有收到任何信号，所以此时该进程的pending表一直是全0，而当我们使用 Ctrl + c 向该进程发送2号信号后，由于2号信号是阻塞的，因此2号信号一直处于未决状态，所以我们看到pending表中的第二个数字一直是1。

为了看到2号信号递达后pending表的变化，我们可以设置一段时间后，自动解除2号信号的阻塞状态，解除2号信号的阻塞状态后2号信号就会立即被递达。因为2号信号的默认处理动作是终止进程，所以为了看到2号信号递达后的pending表，我们可以将2号信号进行捕捉，让2号信号递达时执行我们所给的自定义动作。

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <signal.h>

using namespace std;

void PrintPending(const sigset_t* set)
{
    for(int i = 1; i < 31; i++)
    {
        if(sigismember(set, i) > 0)
        {
            cout << '1';
        }
        else
        {
            cout << '0';
        }
    }
    cout << endl << endl;
}

void myhandler(int signal)
{
    cout << "success capcure!" << endl;
}

int main()
{
    signal(SIGINT, myhandler); //需要进行捕获，不然屏蔽一解除，就进行就断了
    //用户层操作
    sigset_t set, oset; //位图类型
    sigemptyset(&set); //初始化位图set，将位图全部bit位置为0
    sigemptyset(&oset);

    sigaddset(&set, SIGINT); //在位图中添加2号信号
    
    //调用系统接口将数据传入内核，内核操作
    int n = sigprocmask(SIG_SETMASK, &set, &oset); //使用新的位图，修改block表，对2号信号进行阻塞
    if(n < 0)
    {
        perror("main::sigprocmask");
        return 1;
    }

    sigset_t pending; 
    sigemptyset(&pending); //初始化

    int cnt = 0;
    while(true)
    {   
        sigpending(&pending);  //sigpending 系统调用接口 获取当前pending表
        PrintPending(&pending);

        cnt++;
        sleep(1);

        if(cnt == 20)
        {
            sigprocmask(SIG_SETMASK, &oset, NULL);
            printf("信号解除屏蔽！！!\n");
        }
    }

    return 0;
}

此时就可以看到，进程收到2号信号后，该信号在一段时间内处于未决状态，当解除2号信号的屏蔽后，2号信号就会立即递达，执行我们所给的自定义动作，而此时的pending表也变回了全0。

细节： 在解除2号信号后，2号信号的自定义动作是在打印"恢复信号屏蔽字"之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞，则在sigprocmask函数返回前，至少将其中一个信号递达。

信号的捕获

捕捉信号

内核空间与用户空间

每一个进程都有自己的进程地址空间，该进程地址空间由内核空间和用户空间组成：

用户所写的代码和数据位于用户空间，通过用户级页表与物理内存之间建立映射关系。
内核空间存储的实际上是操作系统代码和数据，通过内核级页表与物理内存之间建立映射关系。

内核级页表是一个全局的页表，它用来维护操作系统的代码与进程之间的关系。因此，在每个进程的进程地址空间中，用户空间是属于当前进程的，每个进程看到的代码和数据是完全不同的，但内核空间所存放的都是操作系统的代码和数据，所有进程看到的都是一样的内容即：就算有50个进程，有50个不同的页表，但内核级页表始终只有一个。

需要注意的是，虽然每个进程都能够看到操作系统，但并不意味着每个进程都能够随时对其进行访问。

如何理解进程切换？

在当前进程的进程地址空间中的内核空间，找到操作系统的代码和数据。
执行操作系统的代码，将当前进程的代码和数据剥离下来，并换上另一个进程的代码和数据。（为什么需要操作系统呢？操作系统是硬件的管理者，在进行进程切换时，本质就是将进程从CPU上剥离下来，执行另一个进程，因为CPU是硬件，所以这一系列操作就需要操作系统来完成）

**注意：**当你访问用户空间时你必须处于用户态，当你访问内核空间时你必须处于内核态。

内核态与用户态：

内核态通常用来执行操作系统的代码，是一种权限非常高的状态。
用户态是一种用来执行普通用户代码的状态，是一种受监管的普通状态。

进程收到信号之后，并不是立即处理信号，而是在合适的时候，这里所说的合适的时候实际上就是指，从内核态切换回用户态的时候，在切换时它才会处理信号。

内核态与用户态

内核态和用户态之间是进行如何切换的？

从用户态切换为内核态通常有如下几种情况：

需要进行系统调用时。
当前进程的时间片到了，导致进程切换。
产生异常、中断、陷阱等。

与之相对应，从内核态切换为用户态有如下几种情况：

系统调用返回时。
进程切换完毕。
异常、中断、陷阱等处理完毕。

其中，由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时，本质上是因为我们需要执行操作系统的代码，比如系统调用函数是由操作系统实现的，我们要进行系统调用就必须先由用户态切换为内核态。

内核如何实现信号的捕捉

当我们在执行主控制流程的时候，可能因为某些情况而陷入内核，当内核处理完毕准备返回用户态时，就需要进行信号pending的检查。（此时仍处于内核态，有权力查看当前进程的pending位图）

在查看pending位图时，如果发现有未决信号，并且该信号没有被阻塞，那么此时就需要该信号进行处理。

如果待处理信号的处理动作是默认或者忽略，则执行该信号的处理动作后清除对应的pending标志位，如果没有新的信号要递达，就直接返回用户态，从主控制流程中上次被中断的地方继续向下执行即可。

但如果待处理信号是自定义捕捉的，即该信号的处理动作是由用户提供的，那么处理该信号时就需要先返回用户态执行对应的自定义处理动作，执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位，如果没有新的信号要递达，就直接返回用户态，继续执行主控制流程的代码。

当待处理信号是自定义捕捉时的情况比较复杂，可以借助下图进行记忆：

当识别到信号的处理动作是自定义时，能直接在内核态执行用户空间的代码吗？

理论上来说是可以的，因为内核态是一种权限非常高的状态，但是绝对不能这样设计。

如果允许在内核态直接执行用户空间的代码，那么用户就可以在代码中设计一些非法操作，比如清空数据库等，虽然在用户态时没有足够的权限做到清空数据库，但是如果是在内核态时执行了这种非法代码，那么数据库就真的被清空了，因为内核态是有足够权限清空数据库的。

也就是说，不能让操作系统直接去执行用户的代码，因为操作系统无法保证用户的代码是合法代码，即操作系统不信任任何用户。

sigaction函数

捕捉信号除了用前面用过的signal函数之外，我们还可以使用sigaction函数对信号进行捕捉，sigaction函数的函数原型如下:

cpp 复制代码

int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

sigaction函数可以读取和修改与指定信号相关联的处理动作

函数调用成功返回0，否则，出错返回-1

sigaction函数参数解释如下：

signum代表指定信号的编号。
若act指针非空，将用户自定义的信号动作，传递给操作系统
若oact指针非空，保存修改之前的信号动作

其中act和oact函数的内容都是struct sigaction指针类型

该结构体内容如下：

cpp 复制代码

struct sigaction {
    void (*sa_handler)(int);
    void (*sa_sigaction)(int, siginfo_t *, void *);
    sigset_t sa_mask;
    int sa_flags;
    void (*sa_restorer)(void);
};

struct sigaction结构体中需要我们认识和掌握的成员有两个void (*sa_handler)(int);和sigset_t sa_mask;

void (*sa_handler)(int)

将sa_handler赋值为常数SIG_IGN传给sigaction函数，表示忽略信号。
将sa_handler赋值为常数SIG_DFL传给sigaction函数，表示执行系统默认动作。
将sa_handler赋值为一个函数指针，表示用户自定义函数捕捉信号

sigset_t sa_mask

首先需要说明的是，当某个信号的处理函数被调用，内核自动将当前信号加入进程的信号屏蔽字，当信号处理函数返回时自动恢复原来的信号屏蔽字，这样就保证了在处理这个函数期间，操作系统如果一直接收到相同的信号，那么它会被阻塞到当前处理结束为止，如果没有这样的设计，那么这个信号的handler方法会被不断的嵌套调用

如果在调用信号处理函数时，除了当前信号被自动屏蔽之外，还希望自动屏蔽另外一些信号，则用sa_mask字段说明这些需要额外屏蔽的信号，当信号处理函数返回时，自动恢复原来的信号屏蔽字。

tips：pending是在什么时候修改位图的？在调用handler表之前就将该信号的位图由1置0了

cpp 复制代码

#include <iostream>
#include <cstring>
#include <signal.h>
#include <unistd.h>

using namespace std;

struct sigaction act, oact;

void myhandler(int signal)
{
    cout << "success capture!" << endl;
    sigaction(SIGINT, &oact, nullptr);
}

int main()
{
    memset(&act, 0, sizeof(act)); //memset函数是按照一个字节一个字节的形式帮你初始化
    memset(&oact, 0, sizeof(oact));

    act.sa_handler = myhandler;

    sigemptyset(&act.sa_mask);
    sigaction(SIGINT, &act, &oact);
    while(true)
    {
        cout << "Process Running!!" << endl;
        sleep(1);
    }

    return 0;
}

例如，下面我们用sigaction函数对2号信号进行了捕捉，将2号信号的处理动作改为了自定义的打印动作，并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作。

可重入函数

以上代码的具体操作图：

最终结果是，main函数和sighandler函数先后向链表中插入了两个结点，但最后只有node1结点真正插入到了链表中，而node2结点就再也找不到了，造成了内存泄漏。

如果一个函数在被重入的情况下出错了或者可能出错，我们就称该函数为不可重函数，反之，如果一个函数只访问自己的局部变量或参数，则称之为可重入（Reentrant）函数。

如果一个函数符合以下条件之一则是不可重入的：

调用了malloc或free，因为malloc也是用全局链表来管理堆的。
调用了标志I/O库函数，因为标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

volatile

volatile是C语言的一个关键字，该关键字的作用是保持内存的可见性。

cpp 复制代码

#include <iostream>
#include <cstring>
#include <signal.h>
#include <unistd.h>

int flag = 0;
struct sigaction act;

using namespace std;

void myhandler(int signal)
{
    cout << "get a signal: " << signal << endl;
    flag = 1;
}

int main()
{
    memset(&act, 0, sizeof(act));

    act.sa_handler = myhandler;

    sigemptyset(&act.sa_mask);
    sigaction(SIGINT, &act, nullptr);
    
    while(!flag)
    {
        printf("Running Process!!!\n");

        sleep(1);
    }

    return 0;
}

键入CTRL-C ，2号信号被捕捉，执行自定义动作，修改flag＝1，while条件不满足，退出循环，进程退出

代码中的main函数和handler函数处于不同栈帧是两个独立的执行流，而while循环是在main函数当中的，在编译器编译时只能检测到在main函数中对flag变量的使用。此时编译器检测到在main函数中并没有对flag变量做修改操作，在编译器优化级别较高的时候，就有可能将flag设置进寄存器里面从而提高效率（因为在CPU进行访址时需要将虚拟地址给MMU进行虚拟到物理转换）。

此时main函数在检测flag时只检测寄存器里面的值，而handler执行流只是将内存中flag的值置为1了，那么此时就算进程收到2号信号也不会跳出死循环。

cpp 复制代码

#include <stdio.h>
#include <signal.h>
#include <unistd.h>

int flag = 0;

void handler(int signal)
{
    printf("get a signal: %d\n", signal);
    flag = 1;
}

int main()
{
    signal(SIGINT, handler);

    while(!flag);
    printf("Process Running!!!\n");

    return 0;
}

在编译代码时携带 -O3 选项使得编译器的优化级别最高，此时再运行该代码，就算向进程发生2号信号，该进程也不会终止。

面对这种情况，我们就可以使用volatile关键字对flag变量进行修饰，告知编译器，让CPU取内存只能获取flag变量的值，即保持了内存的可见性。

cpp 复制代码

#include <stdio.h>
#include <signal.h>
#include <unistd.h>

volatile int flag = 0;

void handler(int signal)
{
    printf("get a signal: %d\n", signal);
    flag = 1;
}

int main()
{
    signal(SIGINT, handler);

    while(!flag);
    printf("Process Running!!!\n");

    return 0;
}

此时就算我们编译代码时携带-O3选项，当进程收到2号信号将内存中的flag变量置1时，main函数执行流也能够检测到内存中flag变量的变化，进而跳出死循环正常退出。

SIGCHLD信号（17号信号）

为了避免出现僵尸进程，父进程需要使用wait或waitpid函数等待子进程结束，父进程可以阻塞等待子进程结束，也可以非阻塞地查询的是否有子进程结束等待清理，即轮询的方式。采用第一种方式，父进程阻塞就不能处理自己的工作了；采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。

其实，子进程在终止时会给父进程发生SIGCHLD信号，该信号的默认处理动作是忽略，父进程可以自定义SIGCHLD信号的处理动作，这样父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时会通知父进程，父进程在信号处理函数中调用wait或waitpid函数清理子进程即可。例如，下面代码中对SIGCHLD信号进行了捕捉，并将在该信号的处理函数中调用了waitpid函数对子进程进行了清理。

例如，下面代码中对SIGCHLD信号进行了捕捉，并将在该信号的处理函数中调用了waitpid函数对子进程进行了清理。

cpp 复制代码

#include <stdio.h>
#include <signal.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>

void myhandler(int signal)
{
    sleep(2); //等待两秒之后进行回收查看子进程状态
    pid_t rid;
    while((rid = waitpid(-1, nullptr, WNOHANG)) > 0) //-1表示等待任意子进程
    {
        printf("waitpid success!!!\n");
    }
}

int main()
{
    signal(SIGCHLD, myhandler);
    pid_t id = fork();
    if(id == 0)
    {
        printf("I am child process!!!\n");

        sleep(5);
        exit(0);
    }

    while(true);
    
    return 0;
}

注意：

SIGCHLD属于普通信号，记录该信号的pending位只有一个，如果在同一时刻有多个子进程同时退出，那么在handler函数当中实际上只清理了一个子进程，因此在使用waitpid函数清理子进程时需要使用while不断进行清理。
使用waitpid函数时，需要设置WNOHANG选项，即非阻塞式等待，否则当所有子进程都已经清理完毕时，由于while循环，会再次调用waitpid函数，此时就会在这里阻塞住，这里等待多个进程必须使用非阻塞轮询，例如：你创建了十个进程只有五个进程结束时，第六个进程在被回收时回卡在while循环中，阻塞的方式会一直进行等待直到该进程结束。

此时父进程就只需专心处理自己的工作，不必关心子进程了，子进程终止时父进程收到SIGCHLD信号，会自动进行该信号的自定义处理动作，进而对子进程进行清理。

事实上，由于UNIX的历史原因，要想不产生僵尸进程还有另外一种办法：父进程调用signal或sigaction函数将SIGCHLD信号的处理动作设置为SIG_IGN（忽略），这样fork出来的子进程在终止时会自动清理掉，不会产生僵尸进程，也不会通知父进程，如果想知道推出结果必须等待，父进程得最后一个退出，它需要避免子进程变成孤儿进程。系统默认的忽略动作和用户用signal或sigaction函数自定义的忽略通常是没有区别的，但这是一个特列。此方法对于Linux可用，在其他类Linux系统上无用。

cpp 复制代码

#include <stdio.h>
#include <signal.h>
#include <unistd.h>
#include <stdlib.h>

int main()
{
    signal(SIGCHLD, SIG_IGN);
    pid_t id = fork();
    if(id == 0)
    {
        printf("I am child process!!!\n");

        sleep(5);
        exit(0);
    }

    while(true);
    
    return 0;
}

此时子进程在终止时会自动被清理掉，不会产生僵尸进程，也不会通知父进程。

Linux 进程信号

信号

生活角度的信号

技术应用角度的信号

signal函数

信号概念

用kill -l命令可以察看系统定义的信号列表

信号处理常见方式概览

信号的产生

通过键盘组合键发送信号

通过系统函数向进程发信号

由软件条件产生信号

由硬件异常产生信号

信号的保存

阻塞信号 ​ ​

在内核中的表示

sigset_t

信号集操作函数

管理信号的函数

sigprocmask函数

sigpending函数

信号的捕获

捕捉信号

内核空间与用户空间

内核态与用户态

内核如何实现信号的捕捉

sigaction函数

可重入函数

volatile

SIGCHLD信号（17号信号）

阻塞信号