AQS 源码解析

JDK 14 的 AQS 相比 JDK 8 有了较大的改进,之后一直到 JDK 17 都没有改动,本文以 JDK 17 的源码为例,学习 AQS 的设计。前置知识:CLH 锁LockSupport、常用的锁工具如ReentrantLock基本用法。

概述

AbstractQueuedSynchronizer(AQS)是 Java 并发包中提供的一个用于构建锁和其他同步器的框架。AQS 采用了基于 CLH 锁的 FIFO 等待队列,通过队列中的节点来管理等待线程。当一个线程尝试获取锁但失败时,它会被包装成一个节点并加入等待队列,然后进入自旋等待状态。当持有锁的线程释放锁时,它会唤醒等待队列中的第一个节点,使其有机会获取锁。

AQS 的主要目标是提供一种灵活的、可重用的框架,使得开发人员能够相对容易地构建各种形式的同步器,例如 ReentrantLockSemaphoreCountDownLatch 等,不同类型的同步器只需要实现获取锁和释放锁的逻辑即可,而其它部分则由 AQS 提供了通用的框架。

类结构

顶层的AbstractOwnableSynchronizer很简单,里面定义了一个exclusiveOwnerThread 排他性的拥有者线程,表示当前拥有锁的线程实例,但是在 AQS 中并没有使用,子类实现的具体的同步器可能会用到。

java 复制代码
public abstract class AbstractOwnableSynchronizer implements java.io.Serializable {
    private transient Thread exclusiveOwnerThread;
}

子类AbstractQueuedSynchronizer内部定义了队列的节点 Node,通过 prev/next 串联起来构成等待队列,并扩展出三个子类:

  • ExclusiveNode 排他节点
  • SharedNode 共享节点
  • ConditionNode 条件节点

AQS 队列本身主要有 head, tail, state 三个重要属性:

java 复制代码
public abstract class AbstractQueuedSynchronizer extends AbstractOwnableSynchronizer {

    private transient volatile Node head;    // 等待队列的对头
    private transient volatile Node tail;    // 等待队列的队尾
    private volatile int state;              // 队列的同步状态


    // 队列节点所关联线程的几个状态常量(注意和队列的状态区别开)
    static final int WAITING   = 1;          // must be 1 线程等待
    static final int CANCELLED = 0x80000000; // must be negative 取消等待
    static final int COND      = 2;          // in a condition wait 条件等待

    // 抽象队列节点
    abstract static class Node {
        volatile Node prev;
        volatile Node next;
        
        // 节点关联的请求线程
        Thread waiter;
        
        // 节点状态,非负值表示正常
        volatile int status;      // written by owner, atomic bit ops by others

        // 配套工具方法
    }


    // Condition 实现
    public class ConditionObject implements Condition {
        private transient ConditionNode firstWaiter;
        private transient ConditionNode lastWaiter;
        // Condition 配套方法
    }
}

队列构造

当第一次有线程获取不到锁,关联的节点需要暂时入队时,会初始化同步器,也就是 AQS 等待队列,对应tryInitializeHead()方法,初始化之后队列的头尾节点指向同一个 ExclusiveNode,这个头节点只是作为占位的虚拟节点,并不实际代表某个线程。

然后再次尝试获取锁,如果还是拿不到就真的要把当前线程封装成 Node 入队了,后续如果有更多线程竞争资源,也是一样的放到队尾,只不过源码中入队的操作很克制,只有多次自旋拿不到资源才会真的入队。

核心方法

以 ReentrantLock 可重入锁为例,当执行 lock 加锁时,就会间接调用 AQS 的核心acquire/acquireInterruptibly/tryAcquireNanos 这些获取方式去尝试竞争资源,内部会通过具体的子类定义的tryAcquire去尝试修改 state 表示获取资源。

而执行 unlock 解锁时,就会通过 AQS 的release -> tryRelease方法修改 state 变量以释放资源,然后通过signalNext唤醒下一个等待队列中的线程,完成共享资源的竞争和释放。因此说,AQS 提供的一种模板方法。

通常,同步器需要重写的模板调用方法有五个:

方法名 描述
boolean tryAcquire(int) 独占式获取同步状态,实现此方法需要查询当前状态并判断同步状是否符合预期,然后再进行CAS设置同步状态
boolean tryRelease(int) 独占式释放同步状态,等待获取同步状态的线程将有机会获取同步状态
boolean isHeldExclusively() 当前同步器是否在独占模式下被线程占用,一般此方法表示是否被当前线程所独占
int tryAcquireShared(int) 共享式获取同步状态,反加大于等于0(等于0表示下个等待节点可能获取锁失败,大于0表示后面的等待节点获取锁很可能成功),表示获取成功,反之,获取失败。
boolean tryReleaseShared(int) 共享式释放同步状态

acquire

java 复制代码
final int acquire(Node node,                // 一般是 null,除非是 ConditionNode
                  int arg,                  // 请求参数,例如重入次数
                  boolean shared,           // 排他/共享
                  boolean interruptible,    // 是否可中断
                  boolean timed,            // 是否超时
                  long time) {              // 超时事件,单位纳秒
    
    Thread current = Thread.currentThread();
    byte spins = 0, postSpins = 0;   // retries upon unpark of first thread
    boolean interrupted = false, first = false;
    
    // 入队之后当前线程关联节点的前继
    Node pred = null;

    for (;;) {        
        if (!first 
            && (pred = (node == null) ? null : node.prev) != null // 入队前 node = null 跳过这里
            && !(first = (head == pred)))                         // 入队后如果当前线程不是 head 的直接后继,即队列里还有其它线程在等待走这段逻辑
        
        {
            // 前继已经取消,需要清理已经取消的节点,然后重新循环
            if (pred.status < 0) {
                cleanQueue();
                continue;
            } else if (pred.prev == null) { // 前继已经是 head 队头了
                Thread.onSpinWait();
                continue;
            }
        }

        // 没入队,或者入队后是 head 的直接后继
        if (first || pred == null) {
            // 尝试获取资源
            // 例如 ReentrantLock 校验 state 修改 exclusiveOwnerThread 为本线程来获取锁
            boolean acquired;
            try {
                if (shared)
                    acquired = (tryAcquireShared(arg) >= 0);
                else
                    acquired = tryAcquire(arg);
            } catch (Throwable ex) {
                cancelAcquire(node, interrupted, false);
                throw ex;
            }

            // 拿到锁了就返回,整个方法唯一的正常结束点
            // 其它分支都会继续循环,除非超时/中断/异常
            if (acquired) {
                // 如果当前是头节点的直接后继,head 出队,node 成为新的 head(head 出队,而不是 node 出队,应该是可以简化指针的切换)
                if (first) {
                    node.prev = null;
                    head = node;
                    pred.next = null;
                    node.waiter = null;
                    if (shared)
                        signalNextIfShared(node);
                    if (interrupted)
                        current.interrupt();
                }
                return 1;
            }
        }

        // 资源正被其它线程占有,当前线程需要关联一个节点入队
        if (node == null) {  
            if (shared)
                node = new SharedNode();
            else
                node = new ExclusiveNode();
        } else if (pred == null) {          
            // 这里是 else,也就是说,真正入队之前会再自旋一次,因为入队的开销是比较大的
            // 如果只有一个等待的线程,那么 pred 一直为 null,一直在这里循环
            node.waiter = current;
            Node t = tail;
            node.setPrevRelaxed(t);  
            
            if (t == null)                  // 第一次有节点入队才初始化 AQS 队列,初始化完了之后再自旋一次
                tryInitializeHead();
            else if (!casTail(t, node))     // 将 tail 指向 node,如果失败设置 pred = node.prev = null 后重试
                node.setPrevRelaxed(null);
            else                            // 原来队尾的 next 指向 node 完成入队
                t.next = node;
        } else if (first && spins != 0) {   // 被 unpark 唤醒后又没抢到资源,尝试多次自旋
            --spins; 
            Thread.onSpinWait();            // CPU 指令,高效自旋
        } else if (node.status == 0) {      // 自旋完了还是没抢到,修改 state 状态后再自旋一次;如果还是抢不到,就又要被 park 了.../(ㄒoㄒ)/~~
            node.status = WAITING;
        } else {                            // 拿锁失败,park
            long nanos;
            // 自旋次数 = 2^n + 1 随着被 park 次数增加而增加,使得长期未拿到资源的线程有更多自旋机会,更容易拿到
            spins = postSpins = (byte)((postSpins << 1) | 1);
            // 一直到这里都还没拿到资源,就会 park 暂停线程,等待其它线程 unpark
            if (!timed)
                LockSupport.park(this);
            else if ((nanos = time - System.nanoTime()) > 0L)
                LockSupport.parkNanos(this, nanos);
            else
                break;
            // 到这里说明其它某个线程执行了 unpark,当前线程清除 state 状态开始竞争资源
            node.clearStatus();
            if ((interrupted |= Thread.interrupted()) && interruptible)
                break;
        }
    }
    // 异常/超时/中断,取消竞争
    return cancelAcquire(node, interrupted, interruptible);
}

关于cleanQueue方法,在多线程下麻烦死的指针变换可以看这里:Jdk17 AQS cleanQueue方法源码分析

release

java 复制代码
// AQS#release
public final boolean release(int arg) {
    if (tryRelease(arg)) {      // 由实现类定义
        signalNext(head);
        return true;
    }
    return false;
}

// AQS#signalNext
// h 一般就是对头 head,除了在 cleanQueue 里是要清除的已取消节点
private static void signalNext(Node h) {
    Node s;
    if (h != null && (s = h.next) != null && s.status != 0) {
        // 修改后继节点的 state = ~WAITING
        s.getAndUnsetStatus(WAITING);
        // 唤醒等待的线程
        LockSupport.unpark(s.waiter);
    }
}

条件队列

AQS 里面还定义了一个 ConditionObject 条件对象,JDK 里面唯一的 Condition 接口实现类,和 ConditionNode 一起构建条件队列,应用于各种 BlockingQueue、CyclicBarrier 等工具。

条件队列入对的对外接口是各种await方法,将线程关联的节点移出 AQS 的等待队列,移入某个条件对象的条件队列:

java 复制代码
public final void await() throws InterruptedException {
    if (Thread.interrupted())
        throw new InterruptedException();
    ConditionNode node = new ConditionNode();
    
    // 进入条件队列,并释放所持有的资源
    int savedState = enableWait(node);
    // 设置当前对象为阻塞资源
    LockSupport.setCurrentBlocker(this);
    
    boolean interrupted = false, cancelled = false, rejected = false;
    // 必须不在 AQS 的等待队列里
    while (!canReacquire(node)) {
        if (interrupted |= Thread.interrupted()) {
            if (cancelled = (node.getAndUnsetStatus(COND) & COND) != 0)
                break; 
        } else if ((node.status & COND) != 0) {
            try {
                // 阻塞关联线程
                if (rejected)
                    node.block();
                else
                    ForkJoinPool.managedBlock(node);
            } catch (RejectedExecutionException ex) {
                rejected = true;
            } catch (InterruptedException ie) {
                interrupted = true;
            }
        } else
            Thread.onSpinWait();    // awoke while enqueuing
    }

    // 到这里说明其它线程 unpark 了,撤销阻塞对象,清除状态后竞争资源
    LockSupport.setCurrentBlocker(null);
    node.clearStatus();
    acquire(node, savedState, false, false, false, 0L);
    if (interrupted) {
        if (cancelled) {
            unlinkCancelledWaiters(node);
            throw new InterruptedException();
        }
        Thread.currentThread().interrupt();
    }
}

反之,唤醒则对应signal->doSignal方法,从条件队列中移出,进入 AQS 等待队列中,之后便拥有竞争锁的权利:

java 复制代码
// ConditionObject#doSignal
private void doSignal(ConditionNode first, boolean all) {
    while (first != null) {
        ConditionNode next = first.nextWaiter;
        if ((firstWaiter = next) == null)
            lastWaiter = null;
        if ((first.getAndUnsetStatus(COND) & COND) != 0) {
            enqueue(first);
            if (!all)
                break;
        }
        first = next;
    }
}

// AQS#enqueue
final void enqueue(Node node) {
    if (node != null) {
        for (;;) {
            Node t = tail;
            node.setPrevRelaxed(t);        // avoid unnecessary fence
            if (t == null)                 // initialize
                tryInitializeHead();
            else if (casTail(t, node)) {
                t.next = node;
                if (t.status < 0)          // wake up to clean link
                    LockSupport.unpark(node.waiter);
                break;
            }
        }
    }
}

同步器实现

JUC 包里的很多同步器都是基于 AQS 暴露的 API 实现的,通过在内部定义一个继承自 AQS 的 Sync 实例,重写 acquire/release 等方法。不同的同步器主要的区别就在于对队列同步状态的不同定义:

Synchronizer State Definition
ReentrantLock 资源表示独占锁。state 为 0 表示锁可用;为 1 表示被占用;为 N 表示重入次数
CountDownLatch 资源表示倒数计数器。state 为 0 表示计数器归零;所有线程都可以访问资源;为 N 表示计数器未归零,所有线程都需要阻塞
Semaphore 资源表示信号量/令牌。state ≤ 0 表示没有令牌可用,所有线程都需要阻塞;大于 0 表示由令牌可用,线程每获取一个令牌 state减 1,线程没释放一个令牌,state 加 1
ReentrantReadWriteLock 资源表示共享的读锁和独占的写锁。state 逻辑上被分成两个 16 位的 unsigned short,分别记录读锁被多少线程使用和写锁被重入的次数

以 ReentrantLock 为例,里面定义了 Sync 同步器继承自 AQS,实现了tryLock快速尝试加锁方法,以及initialTryLock抽象方法用于校验可重入性,以及支持是否公平,在任何 lock 方法执行前,都要前执行该方法尝试是否能加锁。其他的还有一些用于提供支持,以及超时、中断相关的方法。

java 复制代码
abstract static class Sync extends AbstractQueuedSynchronizer {
    final boolean tryLock() {
        Thread current = Thread.currentThread();
        int c = getState();
        if (c == 0) {    // 尝试直接加锁
            if (compareAndSetState(0, 1)) {
                setExclusiveOwnerThread(current);
                return true;
            }
        } else if (getExclusiveOwnerThread() == current) {  // 重入
            if (++c < 0) // state 是 int 型,因此支持最多重入 Integer.MAX_VALUE 次
                throw new Error("Maximum lock count exceeded");
            setState(c);
            return true;
        }
        return false;
    }

    abstract boolean initialTryLock();

    // .......
}

非公平锁实现 NonfairSync 很简单,initialTryLock 就是简单的校验 state 数值然后直接去加锁:

java 复制代码
static final class NonfairSync extends Sync {
    final boolean initialTryLock() {
        Thread current = Thread.currentThread();
        if (compareAndSetState(0, 1)) {
            setExclusiveOwnerThread(current);
            return true;
        } else if (getExclusiveOwnerThread() == current) {
            int c = getState() + 1;
            if (c < 0) // overflow
                throw new Error("Maximum lock count exceeded");
            setState(c);
            return true;
        } else
            return false;
    }

    protected final boolean tryAcquire(int acquires) {
        if (getState() == 0 && compareAndSetState(0, acquires)) {
            setExclusiveOwnerThread(Thread.currentThread());
            return true;
        }
        return false;
    }
}

而在公平锁 FairSync 实现的 initialTryLocktryAcquire 里,如果当前线程没有持有锁,那么必须等 AQS 的等待队列为空才可以去加锁,保证了先来后到:

java 复制代码
static final class FairSync extends Sync {

    final boolean initialTryLock() {
        Thread current = Thread.currentThread();
        int c = getState();
        if (c == 0) {
            // 等待队列为空,且没有被其它线程持有
            if (!hasQueuedThreads() && compareAndSetState(0, 1)) {
                setExclusiveOwnerThread(current);
                return true;
            }
        } else if (getExclusiveOwnerThread() == current) {
            if (++c < 0) // overflow
                throw new Error("Maximum lock count exceeded");
            setState(c);
            return true;
        }
        return false;
    }

    protected final boolean tryAcquire(int acquires) {
        // 等待队列为空,且没有被其它线程持有
        if (getState() == 0 && !hasQueuedPredecessors() &&
            compareAndSetState(0, acquires)) {
            setExclusiveOwnerThread(Thread.currentThread());
            return true;
        }
        return false;
    }
}

读完 AQS 的源码,再去看这些工具类的源码,不过是洒洒水了~

参考

[1]. 自旋锁、排队自旋锁、MCS锁、CLH锁

[2]. www.lilinchao.com/archives/25...

[3]. blog.csdn.net/weixin_4956...

[4]. www.iotxing.com/AQS%E6%BA%9...

[5]. blog.csdn.net/yxl62657149...

PS:花了一天时间把这一通代码读下来,神清气爽,跟之前看 Spring 事务源码一样,没看之前感觉好可怕,但只要静下心慢慢看,其实也还好。其实一开始想看看美团的动态线程池设计的,然后就回过去看了一下线程池源码,然后就来到 AQS 了... 欠下的债总有一天是要还的 读这种复杂源码才发现,不可变的定义有多好,不怕它莫名其妙冒出个子类或者中途在某个地方改了。

相关推荐
2402_8575893622 分钟前
“衣依”服装销售平台:Spring Boot框架的设计与实现
java·spring boot·后端
吾爱星辰1 小时前
Kotlin 处理字符串和正则表达式(二十一)
java·开发语言·jvm·正则表达式·kotlin
哎呦没1 小时前
大学生就业招聘:Spring Boot系统的架构分析
java·spring boot·后端
编程、小哥哥2 小时前
netty之Netty与SpringBoot整合
java·spring boot·spring
IT学长编程3 小时前
计算机毕业设计 玩具租赁系统的设计与实现 Java实战项目 附源码+文档+视频讲解
java·spring boot·毕业设计·课程设计·毕业论文·计算机毕业设计选题·玩具租赁系统
莹雨潇潇3 小时前
Docker 快速入门(Ubuntu版)
java·前端·docker·容器
杨哥带你写代码3 小时前
足球青训俱乐部管理:Spring Boot技术驱动
java·spring boot·后端
郭二哈4 小时前
C++——模板进阶、继承
java·服务器·c++
A尘埃4 小时前
SpringBoot的数据访问
java·spring boot·后端
yang-23074 小时前
端口冲突的解决方案以及SpringBoot自动检测可用端口demo
java·spring boot·后端