互斥量的实现原理探究
文章目录
互斥量的概念
互斥量(mutex)是一种同步原语,用于保护多个线程同时访问共享数据。互斥量提供独占的、非递归的所有权语义:一个线程从成功调用lock
或try_lock
开始,到调用unlock
结束,都拥有互斥量。
何为原子性操作
程序的原子性指:整个程序中的所有操作,要么全部完成,要么全部不完成,不可能停滞在中间某个环节。
原子性在一个操作是不可中断的,要么全部执行成功要么全部执行失败,有着 "同生共死" 的感觉。在多个线程一起执行的时候,一个操作一旦开始,就不会被其他线程所干扰
如果要保证原子性,必须符合以下两条规则:
运算结果并不依赖于变量的当前值,或者能够确保只有一个线程修改变量的值。
变量不需要与其他的状态变量共同参与不变约束。
原理探究
首先给出一段加锁场景的部分代码:
cpp
void route(ThreadData *td)
{
// 加锁
while (true)
{
pthread_mutex_lock(&td->_mutex); // 加锁
if (td->_tickets > 0)
{
// 模拟一次抢票的逻辑
usleep(1000);
printf("%s running, get tickets: %d\n", td->_name.c_str(), td->_tickets);
td->_tickets--;
pthread_mutex_unlock(&td->_mutex); // 解锁
td->_total++;
}
else
{
pthread_mutex_unlock(&td->_mutex); // 解锁
break;
}
}
}
上面这段代码模拟了抢票逻辑,将多线程并行抢票通过锁的加入变为串行执行,有效避免了恶意数据竞争(data race)
。
我们不妨假定有两个线程同时执行到 加锁指令 位置:
(上图左侧部分为加锁和解锁对应的汇编语言代码,其中每一行简单汇编指令的执行都是原子的)
不妨设定 thread-1 先进入 lock 逻辑 (thread-2先进入同理,不影响推断):
(这里的先进入 lock 逻辑,实际上指的是先执行左侧汇编语言中 xchgb &al, mutex
语句)
这就意味着 thread-1先执行交换语句,将系统指定初始的 mutex 值 (存储在内存中) 与寄存器初始值 0 进行交换,从而寄存器中值变为1。
由于汇编语言简单语句的单行执行是原子的,此时thread-1 已经执行完 xchgb &al, mutex
语句,所以不排除 thread-2 紧接着也执行 xchgb &al, mutex
语句的可能。(线程被切换的时机是随时的)
这时我们需要注意:
- CPU寄存器的硬件只有一套,但是寄存器内的数据,属于线程的硬件上下文 !
- 数据在内存中存储时,所有线程都能访问,属于共享资源,但是当数据从内存移动到寄存器时,就属于一个线程私有了 !
当执行线程从 thread-1 变为 thread-2 时,隶属于 thread-1 的寄存器硬件上下文被取走,thread-1::%al 寄存器值为1,CPU内%al寄存器值恢复为空。
所以,当 thread-2 执行 xchgb &al, mutex
语句时,访问到寄存器内存储的内容为自身线程所属寄存器的初始值(thread-2 先前执行了 moveb $0, %al
,所以初始值为0),由于内存中 mutex 初始值1已经被 thread-1 交换取走,此时内存中 mutex 的值为0,进行交换后 %al寄存器 中的值依然为0。
经过汇编的下层判断语句 if(%al寄存器内容 > 0)
不符合条件,故 thread-2 没有成功获得锁,需要执行 goto lock
语句重新申请锁的资源。
综上我们可以看到,所有线程在争锁的时候,只有一个 1 !!!
至此,我们发现 thread-2 想要继续执行,就必须等待 thread-1 释放锁,所以程序的执行流程就由 thread-1 执行到释放锁结束后,将内存中 mutex 变量置为1,thread-2 才终止等待,获得 thread-1 释放的锁后,执行自身的代码逻辑。
引入锁的用途就是为了解决并发访问出现的问题,其问题的本质是多个执行流同时执行访问全局数据的代码 造成的。使用锁保护全局共享资源的本质是通过保护临界区完成的。