Java的AQS源码浅析

最近面试问过很多候选人Java锁有关的知识，可以感受到的是，大家的理解基本都停留在"八股文"的阶段，实质上对Java的锁以及多线程的同步机制这种底层原理，理解的不是很好。网上这类文章已经很多了，但是看了下有好多文章是过时的，典型的例如AQS里的addWaiter方法在JDK16里就没见到，或许代码进行了重构了。

通过文章也梳理一下我一般看源代码的习惯是怎样的。AQS全称是AbstractQueuedSynchronizer，首先他是一个抽象类，其次他使用了队列来进行排队，然后作用是用来做线程间的同步的。他是Java里所有锁的基础，包括CountDownLatch以及读写锁，可重入锁等等都是基于AQS实现的。我们从ReentrantLock入手来管中窥豹，大概得看看AQS的源代码。

首先你要了解的是使用方法，一个典型的ReentrantLock使用方法写在了这个类的注释里。

接着，你要有一个鸟瞰图，从大的层面看一看他的实现，ReentrantLock其实只是一层外层的包装，实际上内部具体是由Sync这个类来实现的，而这个类又有两个子类分别是FairSync和NonfairSync，可以看到这两个子类覆写的是initialTryLock和trayAcquire这两个方法，这说明这两个方法在实现上会有一些差异，也仅仅在这有些差别。

那么现在我们从两个方法入手，分别是lock和tryLock方法，这二者的区别是带try的只是试一下，如果能获取到最好，获取不到就算了，返回一个false告诉你没拿到锁。lock的实现如下：

可以看到他调用的正是子类的initialTryLock方法，接着看看initialTryLock方法，我们取的是NoFairSync，也就是他的默认实现。方法也很简单，通过CAS来尝试着获取锁，如果成功了就把当前的owner设置成本线程，否则的话如果失败了，check下当前的owner是不是本线程，如果是的话，直接state+1，实现了计数，也就是可重入的能力，如果都不是就返回false，获取锁失败了。失败了，就会调用acquire(1)。

这个方法则是由抽象类AQS提供的，方法如下，调用了子类的tryAcquire方法，我们还是看看NoFiairSync的实现。

这里会再次调用CAS来再次尝试一次。

如果还是失败了，则就进入了AQS的acquire的实现，这个方法最复杂也最难懂，是AQS的核心，一眼从参数上看上去就非常复杂，他兼容了share or not share,是否可中断，是否超时等等各种情况，因此复杂度就上来了，我们还是聚焦在当前的场景下，既他传入的是acquire(null, arg, false, false, false, 0L);不share，不中断，不超时....

方法体如下，贴了一部分，不贴全了。

ini 复制代码

for (;;) {
            if (!first && (pred = (node == null) ? null : node.prev) != null &&
                !(first = (head == pred))) {
                if (pred.status < 0) {
                    cleanQueue();           // predecessor cancelled
                    continue;
                } else if (pred.prev == null) {
                    Thread.onSpinWait();    // ensure serialization
                    continue;
                }
            }
            if (first || pred == null) {
                boolean acquired;
                try {
                    if (shared)
                        acquired = (tryAcquireShared(arg) >= 0);
                    else
                        acquired = tryAcquire(arg);
                } catch (Throwable ex) {
                    cancelAcquire(node, interrupted, false);
                    throw ex;
                }
                if (acquired) {
                    if (first) {
                        node.prev = null;
                        head = node;
                        pred.next = null;
                        node.waiter = null;
                        if (shared)
                            signalNextIfShared(node);
                        if (interrupted)
                            current.interrupt();
                    }
                    return 1;
                }
            }
            if (node == null) {                 // allocate; retry before enqueue
                if (shared)
                    node = new SharedNode();
                else
                    node = new ExclusiveNode();
            } else if (pred == null) {          // try to enqueue
                node.waiter = current;
                Node t = tail;
                node.setPrevRelaxed(t);         // avoid unnecessary fence
                if (t == null)
                    tryInitializeHead();
                else if (!casTail(t, node))
                    node.setPrevRelaxed(null);  // back out
                else
                    t.next = node;
            } else if (first && spins != 0) {
                --spins;                        // reduce unfairness on rewaits
                Thread.onSpinWait();
            } else if (node.status == 0) {
                node.status = WAITING;          // enable signal and recheck
            } else {
                long nanos;
                spins = postSpins = (byte)((postSpins << 1) | 1);
                if (!timed)
                    LockSupport.park(this);
                else if ((nanos = time - System.nanoTime()) > 0L)
                    LockSupport.parkNanos(this, nanos);
                else
                    break;
                node.clearStatus();
                if ((interrupted |= Thread.interrupted()) && interruptible)
                    break;
            }
        }

他搞了一个死循环通过多次的循环+if条件来实现一个函数多个功能的目的。

第一次循环先走到这里，先初始化一个node。

ini 复制代码

if (node == null) {                 // allocate; retry before enqueue
                if (shared)
                    node = new SharedNode();
                else
                    node = new ExclusiveNode();
            }

第二次循环到这里，将当前节点加入到tail尾巴上，并把prev指向上一个node，同时把上一个node的next指向当前节点，可以看到这个实现了一个链表。

ini 复制代码

else if (pred == null) {          // try to enqueue
                node.waiter = current;
                Node t = tail;
                node.setPrevRelaxed(t);         // avoid unnecessary fence
                if (t == null)
                    tryInitializeHead();
                else if (!casTail(t, node))
                    node.setPrevRelaxed(null);  // back out
                else
                    t.next = node;
            }

这里插一张网络上的图来说明，更助于理解这段代码，在AQS里有一个数据结构Node，这个数据结构有一个prev和next属性，实现了一个双向链表的功能，每一个调用lock的线程进来，如果拿不到锁就会加入这个队列进行等待，那么这个队列的操作过程就在上面的代码里。

如果队列里没有了节点，当前就是头节点，又来了尝试去获取锁，就是下面这段代码。否则就调用park，挂起当前的线程。

ini 复制代码

if (first || pred == null) {
                boolean acquired;
                try {
                    if (shared)
                        acquired = (tryAcquireShared(arg) >= 0);
                    else
                        acquired = tryAcquire(arg);
                } catch (Throwable ex) {
                    cancelAcquire(node, interrupted, false);
                    throw ex;
                }
                if (acquired) {
                    if (first) {
                        node.prev = null;
                        head = node;
                        pred.next = null;
                        node.waiter = null;
                        if (shared)
                            signalNextIfShared(node);
                        if (interrupted)
                            current.interrupt();
                    }
                    return 1;
                }
            }

以上就是里面的比较核心的内容，如果是你来写，是不是很简单，如果是你会怎么写呢？这段代码比较诟病的地方就是同一个函数做了很多事情，包含初始化node节点，队列的更新，并且是通过多次循环+if来实现了，看起来很难懂。

最后，我们问自己几个问题：

1.锁释放的时候，会如何呢？代码也比较简单，如下，unLock的时候，传入1。

每一次调用release(1)就会扣减一次，对应就是可重入锁的计数器的减少。同时考虑了异常调用，当别的线程试着去释放当前锁的时候，抛错。同时如果锁释放完了，将state设置为0，将当前线程置为空，彻底释放锁。

接下来就是SinalNext(head)，这里使用的是LockSupport.unpark(s.waiter);唤醒我们的头结点，就是插入队列的第一个节点。

2.公平锁和非公平锁有什么差别呢？看了半天，我们发现无论是公平锁还是非公平锁，逻辑似乎都是一样的，都要入队列，都维持了队列，那么说好的非公平锁体现在哪里呢？

原来在公平锁的获取锁的过程中，总是事先判断下队列是否为空，如果不为空则加入等待队列，而非公平锁则不一样，不管你队列空不空，先抢一把再说，有很大概率当前线程就直接抢到了锁，他就没有进入等待队列，这对于先到的线程来说，肯定不公平。所以很多候选人都回答，你公平锁因为要维持队列，所以性能更差显然是不准确的。即使非公平锁他们大概率都要入队列，维持队列，不同的仅仅是获得锁的等待时间不同而已，机会不一样。

总结一下，全篇的内容，主要介绍了AQS的部分实现机制，并通过ReentrantLock的实现简单讲解了AQS的源代码。Java的锁机制也都是通过一个volatile修饰的state变量，通过底层的CAS操作设置这个值实现了锁的功能。同时对于无法获取锁的线程则通过一个双向队列的维持，借助Java自身的park对这些线程设置为等待。在锁释放的时候，再去队列头通过unpark来唤醒该线程继续工作，就是这么简单，没什么神秘的。

最后用chatgpt生成的代码注释帮助理解。

ini 复制代码

/**
 * 尝试获取锁或信号量，如果成功获取则返回1，否则继续尝试获取直至成功或被中断或超时
 *
 * @param node          当前节点
 * @param arg           获取锁或信号量时的参数
 * @param shared        是否是共享模式
 * @param interruptible 是否允许被中断
 * @param timed         是否使用定时等待
 * @param time          定时等待的超时时间
 * @return 成功获取返回1，超时返回0，被中断返回负数
 */
final int acquire(Node node, int arg, boolean shared,
                  boolean interruptible, boolean timed, long time) {
    // 获取当前线程
    Thread current = Thread.currentThread();
    // 用于重试计数的变量
    byte spins = 0, postSpins = 0;
    // 用于标记当前线程是否被中断以及当前节点是否是队列中的首节点
    boolean interrupted = false, first = false;
    // 当前节点的前驱节点
    Node pred = null;

    // 循环尝试获取锁或信号量
    for (;;) {
        // 检查是否是队列中的首节点
        if (!first && (pred = (node == null) ? null : node.prev) != null &&
            !(first = (head == pred))) {
            // 非首节点，检查前驱节点是否已取消或是有新的前驱节点
            if (pred.status < 0) {
                // 前驱节点已取消，清理队列
                cleanQueue();
                continue; // 重新开始循环尝试获取锁或信号量
            } else if (pred.prev == null) {
                // 确保串行化，避免过度自旋
                Thread.onSpinWait();
                continue; // 重新开始循环尝试获取锁或信号量
            }
        }

        // 尝试获取锁或信号量
        if (first || pred == null) {
            // 首节点或前驱节点为null，说明当前节点还未入队列
            boolean acquired;
            try {
                // 尝试获取锁或信号量
                if (shared)
                    acquired = (tryAcquireShared(arg) >= 0);
                else
                    acquired = tryAcquire(arg);
            } catch (Throwable ex) {
                // 取消获取操作，抛出异常
                cancelAcquire(node, interrupted, false);
                throw ex;
            }
            // 如果成功获取锁或信号量
            if (acquired) {
                // 更新头节点和前驱节点的引用，设置节点状态，唤醒其他等待线程
                if (first) {
                    node.prev = null;
                    head = node;
                    pred.next = null;
                    node.waiter = null;
                    if (shared)
                        signalNextIfShared(node);
                    if (interrupted)
                        current.interrupt();
                }
                // 返回成功
                return 1;
            }
        }

        // 尝试入队或重试
        if (node == null) {
            // 未分配节点，分配新节点并重试
            if (shared)
                node = new SharedNode();
            else
                node = new ExclusiveNode();
        } else if (pred == null) {
            // 前驱节点为null，说明当前节点还未入队列，尝试将当前节点入队列
            node.waiter = current;
            Node t = tail;
            node.setPrevRelaxed(t); // 避免不必要的内存屏障
            if (t == null)
                tryInitializeHead();
            else if (!casTail(t, node))
                node.setPrevRelaxed(null); // 入队失败，回退
            else
                t.next = node;
        } else if (first && spins != 0) {
            // 重试次数限制，减少对先前线程的不公平竞争
            --spins;
            // 进行自旋等待
            Thread.onSpinWait();
        } else if (node.status == 0) {
            // 设置状态为等待中，以便其他线程进行唤醒
            node.status = WAITING;
        } else {
            // 需要定时等待
            long nanos;
            spins = postSpins = (byte) ((postSpins << 1) | 1);
            if (!timed)
                LockSupport.park(this); // 非定时等待
            else if ((nanos = time - System.nanoTime()) > 0L)
                LockSupport.parkNanos(this, nanos); // 定时等待
            else
                break; // 超时，结束等待
            // 清除节点的状态
            node.clearStatus();
            // 检查线程是否被中断，并根据需要退出循环
            if ((interrupted |= Thread.interrupted()) && interruptible)
                break;
        }
    }
    // 取消获取操作，并根据中断状态返回相应结果
    return cancelAcquire(node, interrupted, interruptible);
}

（本文作者：任天兵）

关注公众号「哈啰技术」，第一时间收到最新技术推文。