C/C++中互斥量(锁)的实现原理探究

互斥量的实现原理探究

文章目录

互斥量的实现原理探究

互斥量的概念

互斥量（mutex）是一种同步原语，用于保护多个线程同时访问共享数据。互斥量提供独占的、非递归的所有权语义：一个线程从成功调用lock或try_lock开始，到调用unlock结束，都拥有互斥量。

何为原子性操作

程序的原子性指：整个程序中的所有操作，要么全部完成，要么全部不完成，不可能停滞在中间某个环节。

原子性在一个操作是不可中断的，要么全部执行成功要么全部执行失败，有着 "同生共死" 的感觉。在多个线程一起执行的时候，一个操作一旦开始，就不会被其他线程所干扰

如果要保证原子性，必须符合以下两条规则：

运算结果并不依赖于变量的当前值，或者能够确保只有一个线程修改变量的值。

变量不需要与其他的状态变量共同参与不变约束。

原理探究

首先给出一段加锁场景的部分代码：

cpp 复制代码

void route(ThreadData *td)
{
    // 加锁
    while (true)
    {
        pthread_mutex_lock(&td->_mutex);    // 加锁
        if (td->_tickets > 0)
        {
            // 模拟一次抢票的逻辑
            usleep(1000);
            printf("%s running, get tickets: %d\n", td->_name.c_str(), td->_tickets);
            td->_tickets--;
            pthread_mutex_unlock(&td->_mutex); // 解锁
            td->_total++;
        }
        else
        {
            pthread_mutex_unlock(&td->_mutex); // 解锁
            break;
        }
    }
}

上面这段代码模拟了抢票逻辑，将多线程并行抢票通过锁的加入变为串行执行，有效避免了恶意数据竞争(data race)。

我们不妨假定有两个线程同时执行到加锁指令位置：

（上图左侧部分为加锁和解锁对应的汇编语言代码，其中每一行简单汇编指令的执行都是原子的）

不妨设定 thread-1 先进入 lock 逻辑 (thread-2先进入同理，不影响推断)：

（这里的先进入 lock 逻辑，实际上指的是先执行左侧汇编语言中 xchgb &al, mutex 语句）

这就意味着 thread-1先执行交换语句，将系统指定初始的 mutex 值 (存储在内存中) 与寄存器初始值 0 进行交换，从而寄存器中值变为1。

由于汇编语言简单语句的单行执行是原子的，此时thread-1 已经执行完 xchgb &al, mutex 语句，所以不排除 thread-2 紧接着也执行 xchgb &al, mutex 语句的可能。（线程被切换的时机是随时的）

这时我们需要注意：

CPU寄存器的硬件只有一套，但是寄存器内的数据，属于线程的硬件上下文！

数据在内存中存储时，所有线程都能访问，属于共享资源，但是当数据从内存移动到寄存器时，就属于一个线程私有了！

当执行线程从 thread-1 变为 thread-2 时，隶属于 thread-1 的寄存器硬件上下文被取走，thread-1::%al 寄存器值为1，CPU内%al寄存器值恢复为空。

所以，当 thread-2 执行 xchgb &al, mutex 语句时，访问到寄存器内存储的内容为自身线程所属寄存器的初始值（thread-2 先前执行了 moveb $0, %al ，所以初始值为0），由于内存中 mutex 初始值1已经被 thread-1 交换取走，此时内存中 mutex 的值为0，进行交换后 %al寄存器中的值依然为0。

经过汇编的下层判断语句 if(%al寄存器内容 > 0) 不符合条件，故 thread-2 没有成功获得锁，需要执行 goto lock 语句重新申请锁的资源。

综上我们可以看到，所有线程在争锁的时候，只有一个 1 ！！！

至此，我们发现 thread-2 想要继续执行，就必须等待 thread-1 释放锁，所以程序的执行流程就由 thread-1 执行到释放锁结束后，将内存中 mutex 变量置为1，thread-2 才终止等待，获得 thread-1 释放的锁后，执行自身的代码逻辑。

引入锁的用途就是为了解决并发访问出现的问题，其问题的本质是多个执行流同时执行访问全局数据的代码 造成的。使用锁保护全局共享资源的本质是通过保护临界区完成的。