《c++并发编程》中无锁栈的实现为什么要用双引用计数器

背景

《c++并发编程》中,实现无锁栈用了引用计数技术。原因是,pop方法要删除栈顶中的节点,然而,由于1.读取栈顶指针->2.根据栈顶指针访问栈顶节点、获取栈顶节点所保存的数据以及下一个节点指针next_node->3.更新栈顶指针为next_node->4.删除栈顶节点这4个 步骤不能做到原子,所以可能出现下面情况,线程A执行完步骤1后,在执行步骤2之前,线程B一口气执行完步骤1-4,把节点删除了,然后线程A执行步骤2,就是一个空悬指针解引用的错误,因为线程A并不知道他要访问的节点,已经被线程B删除了。为了不让这中情况发生,需要使用引用计数技术,每有一个指针指向一个某个对象,这个对象的引用计数就+1。当指向一个对象的指针不再指向它时,它的引用计数就-1。当它的引用计数减少为0时,把他减为0的线程,要负责删除这个节点。所以,只要还有一个指针在指涉一个对象,这个对象就不会被删除。换句话说,就是让线程B知道线程A中有一个指针在指向它所弹出的节点,使得他不执行步骤4。

在《c++并发编程》实现引用计数用了两个计数器,一个计数器在节点内部,成为内部计数器。一个被称为外部计数器的计数器与指针绑定成结构体counted_node_ptr。栈顶指针的类型从原生指针修改为counted_node_ptr。每当有线程通过载入head指针,外部计数器+1。每当线程不再有指涉某个节点的指针,内部计数器-1,内部计数器+外部计数器=节点的实际引用计数,当它为0时,删除节点,数据结构如下图。(上上句话就是我写这篇博客的原因,我花了好长时间才想通为什么要这么做,为什么要搞内外引用计数器,为什么不合并每个计数器,后面我会讲,但现在,先让我把书本的做法介绍完)

当有线程要弹出数据时,它首先读取head指针(栈顶指针),存到线程局部变量local_head中并让head中的外部计数器+1,这个过程可以做到原子,接着它让local_head的计数器也变为和head中的计数器一样。然后,它通过local_head访问节点。如果它不能弹出节点(判定条件是:local_head与head不相同,也即有其他线程在本线程把head载入到local_head之后,修改了head指针),本线程载入的local_head作废),就把节点的内部计数器-1(本线程马上就不会指向这个节点的指针了)。如果节点的内部计数器因此变为了0(也即他原本为1),则本线程删除这个节点。否则,啥也不做(此时内部计数器可能为负数)。如果它能够弹出数据(判定条件是:old_head仍然与head相同,也即没有其他线程在本线程把head载入到local_head之后,修改head指针),则它把head指针修改为head.ptr->next。注意,判定并修改可以做到原子。然后,local_head的外部计数器-1(因为head指针已经不在指向这个节点),再让local_head的外部计数器-1(因为 local_head也准备不指向这个节点了,实际写代码时,让local_head减2就行,我分开讲是为了说清楚减的2是哪两个1)。然后,把local_head的计数器的值加到内部计数器。如果内部计数器因此变为0,也即他原本为local_head的外部计数器的相反数。则本线程负责把节点删除,否则,不删除节点。

为什么要两个计数器,一个可以吗?

如果一个可以,那考虑这个计数器放再哪里。放在节点内部吗?不行,因为计数器是为了解决空悬指针解引用,如果他放在节点内部,那访问计数器必须先访问节点。考虑下面场景:线程A读取head指针,存到local_head中,还没来得及通过local_head访问节点内部的引用计数器,让他加1,线程B率先访问到了节点引用计数器,让计数器+1。然后弹出节点,退出前,让计数器-1。发现计数器因此变成了0。删除节点。然后线程A才开始通过local_head访问节点内部引用计数器并试图让节点内部计数器+1。但是,节点已经被删除了,又出现了空悬指针解引用。所以,如果一个计数器可行,它只能在节点外面。那放在哪里呢?这个计数器需要让所有线程都能直接访问到(节点不属于所有线程能直接访问到的数据,它只能通过head指针间接访问)。它应该和head指针(所有线程都能直接访问)有相同的地位。参考外部指针,把计数器和head指针合2为1使得读head指针和计数器+1有机会原子进行(否则,读head指针和让计数器+1必定有时间间隙,不可能原子进行,因为他们属于两个不同的变量)。只有一个计数器,那么理论很直观。每有一个指向head节点的指针,就让计数器+1,当指针不再指向这个节点时,让它-1。理想很美好,现实怎么实现呢?

看看下面步骤

线程A载入head 到 local_head(类型为counted_node_ptr)。如果head没有变化,就让head的计数器+1。然后local_head也加1,此时他们head和local_head的计数器都为2。这些步骤都发生在访问节点之前,如果本线程确实要访问local_head指向的节点,由于计数器变为了2,所以节点肯定不会被删除。它之后可以安全地访问local_head指向的节点。但它还没来得及访问,线程B这时候载入head到local_head中,并让head计数器和local_head计数器都变为了3。(它看到head指针为3,就知道,此时除了它自己,还有另一个线程在访问head节点。),它把head指针修改为了head.ptr->next。这时候,head的计数器变为了1,因此此时head指针指向的对象改变了,而那个对象目前只有head指针一个指针在指向它。线程B检查local_head的计数器,让local_head的计数器-2。也即让local_head的计数器变为了1。由于计数器不为0,所以它没有删除节点。它完成了巩工作,pop函数退出。此时线程A安全地访问它的local_head所指向的节点,发现local_head和head已经不一样,所有它放弃弹出这节点。它让local_head的计数器-1,使得local_head的计数器变为了1,由于不为0,所以没有删除节点。这样,这个节点永远都不会被删除了。问题出在哪里呢?计数器应该是节点关联的,它应该存在节点内部,一个节点应该只有一个计数器,但这里,我们无法把计数器放在节点的内部,而放在节点的外部,又需要和head指针拼在一起使得他们读head指针和让计数器+1能够原子进行。这样,就会产生多个计数器,head指针和每个进程各有一个计数器。每个线程让计数器-1,别的进程是不可见的。这就是问题所在。

所以,一个计数器是不行的,除非我们可以让所有的节点有且只有一个计数器,就像shared_ptr那样,可惜,shared_ptr无法做到和读head指针无锁但原子地进行。

双引用计数器的原理是什么

外部计数器:为了线程读读head指针时,知道除了它自己,还有几个线程和自己读取了相同的head。一个线程退出时,如果它修改了head指针它减去自己知道的有2个指针不再指向那个节点,得出一个值x。x就是在它的视角看来,他退出后,还有x个线程在指向这个节点,把这个值加上节点内部计数器,就像是通知这个节点,你的任务已经完成了,但是,由于在我看来,还有x个线程在指向你,除非他们都不再指向你了(内部计数器的值为外部计数器的值的相反数),否则我不能删除你。如果它没有修改head指针,它让节点内部计数器-1,就像告诉节点,我已经不再指向你了,如果你现在没有被其他人引用的话(内部计数器为1),我就删除你,否则,我只是通知你。你后面可以告诉别人我不再引用你了。

内部计数器:有多少个指针在引用自己。但更新滞后,并不是每有一个指针指向它,它就立刻更新。

外部计数器更新及时,但不为所有线程所见,内部计数器为所有线程所见,但更新不及时,他们按照协议相互配合,才能正确工作。

相关推荐
JSU_曾是此间年少1 分钟前
数据结构——线性表与链表
数据结构·c++·算法
此生只爱蛋1 小时前
【手撕排序2】快速排序
c语言·c++·算法·排序算法
何曾参静谧1 小时前
「C/C++」C/C++ 指针篇 之 指针运算
c语言·开发语言·c++
lulu_gh_yu2 小时前
数据结构之排序补充
c语言·开发语言·数据结构·c++·学习·算法·排序算法
ULTRA??3 小时前
C加加中的结构化绑定(解包,折叠展开)
开发语言·c++
凌云行者3 小时前
OpenGL入门005——使用Shader类管理着色器
c++·cmake·opengl
凌云行者3 小时前
OpenGL入门006——着色器在纹理混合中的应用
c++·cmake·opengl
~yY…s<#>4 小时前
【刷题17】最小栈、栈的压入弹出、逆波兰表达式
c语言·数据结构·c++·算法·leetcode
可均可可4 小时前
C++之OpenCV入门到提高004:Mat 对象的使用
c++·opencv·mat·imread·imwrite
白子寰5 小时前
【C++打怪之路Lv14】- “多态“篇
开发语言·c++