C++并发:线程管控

1 线程基本管控

每个C++程序都含有至少一个线程,即运行main()的线程,它由C++运行时系统启动。随后程序可以发起更多线程,它们以别的函数作为入口。这些新线程连同起始线程并发运行。当main()返回时,程序就会退出;同样,当入口函数返回时,对应的线程随之终结。如果借std::thread对象管控线程,即可选择等他结束。

1.1 发起线程

线程通过构造std::thread对象而启动,该对象指明线程要运行的任务。

cpp 复制代码
void do_some_work();
std::thread myThread(do_some_work);

任何可调用类型都适用于std::thread。所以,作为代替,可以设计一个带有函数调用操作符的类(应当是下面的operator)

cpp 复制代码
class background_task
{
public:
    void operator() () const
    {
        do_something();
        do_something_else();
    }
};

background_task f;
std::thread my_thread(f);

f被复制到属于新线程的存储空间中,在那里被调用,由新线程执行。

1.1.1 与函数声明进行区分

如果传入std::thread的是临时变量,不是具名变量,那么调用构造函数的语法有可能与函数声明相同。这种情况,编译器会将其解释成函数声明。

cpp 复制代码
声明为函数:函数名为my_thread,只接收一个参数,返回std::thread对象
std::thread my_thread(background_task());

可以通过多用一对圆括号或使用新式的统一初始化语法
std::thread my_thread((background_task()));
std::thread my_thread{background_task()};

还可以使用lambda表达式
std::thread my_thread([]{
    do_something();
    do_something_else();
});

1.2 汇合与分离

在启动线程后,需要明确是要等待他结束(也就是汇合)还是任由他独立运行(也就是分离)。如果等到std::thread销毁的时候还没有决定好,那么std::thread的析构函数将调用std::terminate()终止整个程序。

如果选择了分离,且分离时新线程还未运行结束,那将继续运行,甚至在std::thread对象销毁很久之后依然运行,它只有最终从线程函数返回时才会结束运行。

假设程序不等待线程结束,那么在线程运行结束前,我们要保证它所访问的外部数据始终正确,有效。由于使用多线程,所以我们可能会经常面临对象生存期的问题。比如下面的案例:

cpp 复制代码
struct func
{
    int& i;
    func(int& i_):i(i_){}
    void operator() ()
    {
        for (unsigned j=0; j<1000000; ++j) 
        {
            do_something(i);    隐患:可能访问悬空引用
        }
    }
};

void oops()
{
    int some_local_state=0;
    func my_func(some_local_state);
    std::thread my_thread(my_func);
    my_thread.detach();        不等待新线程结束
                               新线程可能仍运行,而主线程的函数却已经结束
}

|------------------------------------|-------------------------------------------------------------------------|
| 主线程 | 新线程 |
| 构造my_func对象,引用局部变量some_local_state | |
| 通过my_thread对象启动新线程 | |
| | 新线程启动 |
| | 调用func::operator() |
| 分离新线程my_thread | 运行func::operator(); 调用do_something()函数, 进而引用局部变量some_local_state |
| 销毁局部变量some_local_state | 仍在运行 |
| 退出oops() | 继续运行func::operator(); 调用do_something()函数, 进而引用some_local_state, 导致未定义行为 |

因此:以下做法不可取:意图在函数中创建线程,并让线程访问函数的局部变量。除非线程肯定会在该函数退出前结束。或者是汇合新线程,此举可以保证在主线程的函数退出前,新线程执行完毕。

1.2.1 join---等待线程完成

若需等待线程完成,那么可以在与之关联的std::thread实例上,通过调用成员函数join()实现。对于上面的代码,就是把detach换成join。就能够保证在oops退出前,新线程结束。

对于一个线程,join仅能被调用一次,被调用后线程不再可汇合,成员函数joinable将返回false。

要注意,如果线程启动后有异常抛出,而join尚未执行,该join调用会被略过。

使用thread_guard保证在抛出异常时,退出路径的先后顺序与不抛出异常时一致。

也就是在析构函数中调用join

cpp 复制代码
class thread_guard {
    std::thread& t;
public:
    explicit thread_guard(std::thread& t_) : t(t_)
    {}

    ~thread_guard() {
        if (t.joinable()) {
            t.join();
        }
    }
    thread_guard(thread_guard const&)=delete;
    thread_guard& operator=(thread_guard const&)=delete;
};

struct func {
    int& i;
    explicit func(int& i_) : i(i_) {};
    void operator() () {
        for (unsigned j = 0; j < 1000000; ++j) {
            do_somthing();
        }
    }
};

void f() {
    int some_local_state=0;
    func my_func(some_local_state);
    std::thread t(my_func);
    thread_guard g(t);
    do_something_in_current_thread();
}

1.2.2 detach---在后台运行线程

会令线程在后台运行,因此与之无法直接通信。其归属权和控制权都交给了C++运行时库,由此保证,一旦线程退出,与之关联的资源都会被正确回收。

只有在joinable返回true时,才能调用detach。

2 向线程函数传递参数

直接向std::thread的构造函数增添更多参数即可。需要注意的是,线程具有内部存储空间,参数会按照默认方式先复制到该处,新创建的执行线程才能直接访问它们。然后,这些副本被当成临时变量,以右值的形式传给新线程上的函数或可调用对象。即便函数相关参数按设想应该是引用,上述过程依然会发生。

cpp 复制代码
void f(int i, std::string const& s);
std::thread t(f, 3, "hello");

void f(int i, std::string const& s);
void oops(int some_param)
{
    char buffer[1024];
    sprintf(buffer, "%i", some_param);
    std::thread t(f, 3, buffer);
    // std::thread t(f, 3, std::string(buffer));
    t.detach();
}

但是上述例子将字符串的引用复制到了thread的存储空间,当调用thread的外层函数销毁时,buffer将不存在,无法访问这个引用。可以使用注释里的方法,先转换成std::string对象(buffer相当于一个指针)

cpp 复制代码
void update_data_for_widget(widget_id w, widget_data& data);
void oops_again(widget_id w)
{
    widget_data data;
    std::thread t(update_data_for_widget, w, data);
    display_status();
    t.join();
    process_widget_data(data);
}

根据update_data_for_widget函数的声明,第二个参数会以引用的方式传入update_data_for_widget,但是std::thread的构造函数并不知情,会直接复制提供的值。随后线程库内部会把参数副本当成move-only(只移型别),以右值的形式传递。最终,update_data_for_widget会收到右值,因为update_data_for_widget预期接受非const引用,我们不能向他传递右值。

解决方法是,按照如下方式改写(std::ref)

cpp 复制代码
std::thread t(update_data_for_widget, w, std::ref(data));

这样就保证了传入update_data_for_widget函数的不是变量data的临时副本,而是指向变量data的引用,因此能够编译成功。

2.2 调用对象的方法

若要调用一个对象对应的方法,则需要传递方法地址和对象地址,第三个参数作为该方法的第一个入参。

cpp 复制代码
class X {
public:
    void do_lengthy_work();

};
X my_x;
std::thread t(&X::do_lengthy_work, &my_x);

上述代码调用对象my_x的do_lengthy_work方法。

2.3 只能移动的方式传递参数

3 移交线程归属权

相关推荐
bbqz0074 分钟前
浅说c/c++ coroutine
c++·协程·移植·epoll·coroutine·libco·网络事件库·wepoll
~糖炒栗子~6 分钟前
[Day 11]209.长度最小的子数组
数据结构·c++·算法·leetcode
zym大哥大1 小时前
C++11右值与列表初始化
数据结构·c++
Reoyy3 小时前
Visual Studio 2022安装教程
c++·ide·visual studio
执着的小火车4 小时前
【2024华为OD-E卷-100分-火星文计算】(题目+思路+Java&C++&Python解析)
java·数据结构·c++·算法·华为od·华为
矮油0_o4 小时前
30天开发操作系统 第 11 天 --制作窗口
c语言·开发语言·c++·系统架构
MinBadGuy4 小时前
【GeekBand】C++设计模式笔记20_Composite_组合模式
c++·设计模式
万事大吉CC4 小时前
697: Edit Distance
c++
刀客1234 小时前
C++ 基础思维导图(一)
开发语言·c++
_DCG_4 小时前
c++之左值引用 右值引用 万能引用
java·开发语言·c++