Linux——线程控制

#include<iostream>
#include<unistd.h>
#include<pthread.h>
using namespace std;
 
void* TreadToutine(void *arg)
{
    const char* threadname = (const char*) arg;
    while(1)
    {
        cout<<"我是一个新线程"<<threadname<<endl;
        sleep(1);
    }
}
 
int main()
{
    pthread_t tid;
    pthread_create(&tid,NULL,TreadToutine, (void*)"thread 1");
 
    //主线程
    while(1)
    {
        cout<<"我是主线程"<<endl;
        sleep(1);
    }
    return 0;
}

linux没有真正的线程概念，他的线程是复用的进程代码，只是做了一些区分。线程客观的可以叫做轻量级进程。因此Linux只会提供轻量级进程创建的函数调用，不会直接提供线程创建的接口。因此我们使用pthread原生线程库，编译时需要手动链接库文件（-lpthread）。

这样编译后就可以运行了。

从上面代码可以看出，给线程传递的信息可以是char*，由于pthread_create函数的最后一个参数为void*，同时线程去运行的函数参数也是void*，因此我们任意类型都可以传递过去，进行一下强转即可。

2.线程传递结构体

比如现在我想传递很多内容过去，叫线程帮我们处理

如下，我们传递了结构体

线程成功收到结构体，并做出了处理。

3.创建多线程

创建多线程也很简单，只需要循环创建即可。

4.收到信号的线程

如果进程创建的线程有一个发生了异常，收到了信号，会导致整个进程都被终止，因为线程是进程创建出来的，发送信号是发给了进程，进程如果退出，那么该进程所有的资源也都得被回收。而线程本身就是进程资源的一部分。

二、线程终止

我们知道线程去执行的函数返回类型为void*，当线程执行结束，return时，线程就自动终止了。

如果我们返回时调用exit()函数，那么整个进程都会被终止。

同时，pthread.h库还给我们提供了 pthread_exit() 接口，我们使用该接口也可以终止线程。

pthread_exit()

作用：终止一个运行的线程

参数retval：返回void*的全局变量

注意，pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的，不能在线程函数的栈上分配，因为当其它线程得到这个返回指针时线程函数已经退出了。

代码如下，两种方法都可以退出

运行结果如下，线程被退出，不再打印消息。

三、线程等待

线程退出默认要被等待，如果不等待，就会发生类似于僵尸进程的问题。因此我们需要用pthread_join()函数进行等待

pthread_join()

功能：等待线程结束

参数1：:thread:线程ID

参数2：value_ptr:它指向一个指针，后者指向线程的返回值（void**指向的线程返回值void*）

返回值：成功返回0；失败返回错误码

代码如下，让子线程程循环5次后退出并传参常量字符串，主线程去join等待，并将等待的结果输出。

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <pthread.h>
#include <cstdio>
using namespace std;

class Add
{
public:
    Add(string name, int a, int b)
        : _name(name), _a(a), _b(b)
    {}

public:
    string _name;
    int _a;
    int _b;
};

void *TreadToutine(void *arg)
{
    Add *a1 = (Add *)arg;
    int cnt = 5;
    while (cnt--)
    {
        cout << "我是一个新线程: " << a1->_name << ",计算结果为" << a1->_a + a1->_b << endl;
        sleep(1);
    }
    //return nullptr;
    pthread_exit((void*)"pthread-1 退出"); //常量区
}

int main()
{
    pthread_t tid;
    Add *td = new Add("thread-1", 10, 20);
    pthread_create(&tid, NULL, TreadToutine, td);

    // 主线程
    cout << "我是主线程,子线程的tid: "<< tid << endl;
    void* msg = nullptr;
    pthread_join(tid,&msg);
    cout<<"等待成功,子线程退出信息: "<<(char*)msg <<endl;
    sleep(1);
    return 0;
}

等待成功，同时输出了消息。注意等待是阻塞式等待，子线程退出后才会执行后续代码。

四、线程分离

我们知道，线程是需要被等待的，不然会发生类似于僵尸进程的现象，那么如果我想让线程一直去运行，比如说一直帮我播放音乐，那么主线程就会一直等待，不可能执行后面的代码。

在这种情况下，我们可以让线程分离，也就是主线程不再关心创建的子线程的死活，他要运行就运行，不运行了操作系统会回收。不过一般建议主线程最后再退出。

可以使用pthread_detach()函数进行线程的分离。

pthread_detach()

作用：分离线程

分离线程很简单，直接调用pthread_detach()就可以，我们不过多展示，下面代码是先分离线程，再等待线程看看会发生什么。

发现等待线程的返回值为22，不是0证明等待失败，22的意思是该线程不需要等待。

这是我们是在主线程进行分离的，子线程也可以被分离，由于子线程默认看不到自己的tid，因此可以调用pthread_self()函数获取自己的tid。

pthread_self

作用：让线程获取自己的tid

如下是子线程选择分离。

小总结：

默认情况下，新创建的线程是joinable的，线程退出后，需要对其进行pthread_join操作，否则无法释放资源，从而造成系统泄漏。

如果不关心线程的返回值，join是一种负担，这个时候，我们可以告诉系统，当线程退出时，自动释放线程资源。

五、取消线程

主线程可以取消线程，也就是让子线程退出，可以调用pthread_cancel()函数进行终止线程。

pthread_cancel()

功能：向线程发送取消请求

参数1：thread，线程ID

返回值：成功返回0；失败返回错误码

代码如下，先取消进程，再等待线程，同时查看线程退出码

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <pthread.h>
#include <cstdio>
using namespace std;

void *TreadToutine(void *arg)
{
    while(1)
    {
        cout << "我是一个新线程" << endl;
        sleep(1);
    }
    return nullptr;
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, NULL, TreadToutine, (void *)"pthread-1");
    sleep(3);

    // 取消线程
    int n = pthread_cancel(tid);
    cout << "线程取消成功,n: " << n << endl;
    // 等待线程
    void *ret = nullptr;
    n = pthread_join(tid, &ret);
    cout << "等待线程返回值n: " << n << ",线程返回值: " << (int64_t)ret << endl;
    return 0;
}

运行看到，线程返回值为0，取消成功，等待返回值为0，等待成功。我们看到线程没有阻塞在等待函数这里，而是直接往后运行，同时进程返回为-1。

这是因为如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数 PTHREAD_ CANCELED

而如果线程先被脱离，再取消，结果怎么样呢？

发现也是能被取消的，但是线程等待是22（等待失败）。因为系统直接回收了。

小总结：

如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。

如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数PTHREAD_CANCELED。

如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传给pthread_exit的参数。

如果对thread线程的终止状态不感兴趣,可以传NULL给value_ptr参数。

六、线程库管理的原理

我们对线程的操作一直要使用tid，那么tid里面的内容到底是什么呢？

其实他是一个地址，我们转成16进程来看一下。

确实是很像是地址，但这跟LWP（Light Weight Process）也不一样啊。该如何理解呢？

首先，我们知道pthread. h不是操作系统的接口，而是原生线程库。那么用户创建的线程，操作系统无法管理，则需要线程库来进行管理。他从系统中获取轻量级进程相关属性，从用户中也获取一些属性，这样就先描述起来了，再通过数据结构将线程组织起来，就将线程管理好了。

我们也知道，线程要有独立属性，独立的主要有硬件上下文和栈空间，其中硬件上下文跟操作系统有关，而栈空间则是要从用户中来。栈不是只有一个吗？为什么每一个线程都有自己的栈空间呢？这其实是操作系统帮我们处理了的，操作系统会在堆区创建空间，来充当线程独立的栈。pthread库会获取到栈空间，并将他管理维护好，而默认地址空间中的栈，由主线程使用。

那么线程库如何管理呢，在哪管理呢？

在进程地址空间中，mmap（共享区）加载了动态库，其中我们使用的pthread库就在该区域，他会管理好每一份线程，每一份线程都在其中有自己的属性集。

struct pthread里存在很多线程属性，线程局部存储，还有线程栈，这个栈指向的是堆空间的区域，每当有新线程被创建，都会在后面继续创建这种数据结构。就这样将多个线程统一的描述组织起来了，可以进行管理了。因此我们调用pthread相关函数，相当于对该空间进行访问、处理。

那么现在，我们也可以理解 pthread_t tid 是什么了，他不就是每一个线程在进程地址空间的起始地址嘛，我们pthread_create 对tid进行写入，因为需要创建对应的数据结构，找到起始地址，然后返回，后续用户要继续对线程进行控制，等待啊，终止啊，分离啊，取消啊。都需要传入tid，也就是能找到在进程地址空间的位置后，才可以处理。

七、站在语言角度理解pthread库

我们之前学的pthread库，是Linux提供的原生线程库，在语言层面，比如C++/JAVA\PYTHON，他们也会提供给我们线程库。

我们写了一份代码，使用的是C++提供的线程库 thread

cpp 复制代码

 #include<iostream>
 #include<unistd.h>
 #include<thread>
 using namespace std;

void myrun()
{
    while(1)
    {
        cout<<"我是一个新线程"<<endl;
        sleep(1);
    }
}

 int main()
 {
    thread t(myrun);
    t.join();
 }

编译后运行，发现说多线程操作被禁止了，这是因为我们没有链接pthread库。

c++提供的线程库封装了pthread.h。因此我们编译时仍然需要链接 pthread库。

到现在，我们可以知道，语言上也许线程库的使用不一定相同，但是他们底层都是用的linux原生线程库。

在Linux下做了封装，那么这段代码我们可以在Linux中运行。

如果thread头文件在Windows下，封装了Windows线程的操作，那么也可以在Windows下运行。这大大提高了文件的可移植性。

八、线程的局部存储

我们定义一个全局变量，创建线程，让新线程对全局变量做++，观察新线程和主线程全局变量是否发生变化。

cpp 复制代码

#include <iostream>
#include <unistd.h>
#include <pthread.h>
using namespace std;

int g_val = 100;

void *TreadToutine(void *arg)
{
    while (1)
    {
        cout << "我是一个新线程,g_val: " << g_val << ",&g_val: " << &g_val << endl;
        g_val++;
        sleep(1);
    }
    return nullptr;
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, NULL, TreadToutine, (void *)"Thread 1");
    while (1)
    {
        cout << "我是一个主线程,g_val: " << g_val << ",&g_val: " << &g_val << endl;
        sleep(1);
    }
    pthread_join(tid,nullptr);
}

我们可以看到，全局变量值一样，地址也一样，我们现在知道全局变量是被所有进程共享的。

如果我们给全局变量前添加上__thread，GCC/G++编译器提供的一个扩展，用于声明线程局部存储变量。

现在运行，主线程和新线程g_val不一样，地址也不一样。

因为我们添加的__thread 会在G++编译时，给每个线程的局部存储空间里将变量拷贝进程，私有一份，于是每个线程自己管理自己的那一份资源。不再与外部共享。

只是__thread只能修饰内置类型，如string这种自定义类型无法处理。