java.util.concurrent解析——AbstractQueuedSynchronizer队列管理

来源:互联网 发布:设计软件培训 编辑:程序博客网 时间:2024/06/16 07:08

上一篇博客中,我们提到AQS的队列管理是基于CLH锁队列实现的,所以首先我们来看下CLH锁队列

1 CLH锁队列

CLH锁队列本质上是一个基于链表的FIFO自旋锁队列,队列中的每一个节点实质上是一个自旋锁:在阻塞时不断循环读取状态变量,当前驱节点释放同步对象使用权后,跳出循环,执行同步代码。其基本结构如下:
这里写图片描述

队列中每一个节点有两个成员:

  • 节点状态变量
  • 前驱指针:pred

head,tail并不是实际节点,只是为了表示队列的首尾,被称为dumb node。

在如此结构之下,其enqueue操作逻辑如下:

do { pred = tail;} while(!tail.compareAndSet(pred, node));

其lock操作如下:

public void lock() {  final Node node = new Node();  node.locked = true;  // 一个CAS操作即可将当前线程对应的节点加入到队列中,  // 并且同时获得了前继节点的引用,然后就是等待前继释放锁  Node pred = this.tail.getAndSet(node);  this.prev.set(pred);  while (pred.locked) {// 进入自旋  }}

可以看到其自旋逻辑。

而其dequeue操做更加简单:

head = node;

从面的操作,可以看到CLH锁队列有如下优势:

  • 队列的入列、出列操作原子性完成,无需加锁,高效
  • 判断当前队列等待是否为空同样简单,只需检查head是否为tail即可
  • 每个节点独立维护其状态变量,避免了集中状态管理的内存竞争

2 AQS进程队列

AQS进程队列相比于CLH锁队列主要做了两处修改:

  • 每个节点新增一个next指针。由于AQS队列中的进程不仅有自旋等待,还包括阻塞等待的情况。阻塞等待的队列需要其他队列主动唤醒。这就要求队列中某个节点出列时需要显式告知其后继节点,因而需要加入next指针
  • 节点状态变量status由一个bit替换成一个int。这主要是由于AQS下的状态更加复杂

首先来看下AQS队列节点的基本结构:

static final class Node {     // 表明节点是否以共享模式等待的标记    static final Node SHARED = new Node();    // 表明节点是否以独占模式等待的标记    static final Node EXCLUSIVE = null;    // 表明线程已被取消    static final int CANCELLED =  1;    // 表明后续节点的线程需要unparking    static final int SIGNAL    = -1;    // 表明线程正在等待一个条件    static final int CONDITION = -2;    // 表明下一次acquireShared应该无条件传播    static final int PROPAGATE = -3;    /*     * 状态字段,只能取下面的值:     * SIGNAL(-1):    这个结点的后继是(或很快是)阻塞的(通过park),所以当前结点     *              必须unpark它的后继,当它释放或取消时。为了避免竞争,acquire方法必须     *              首先表明它们需要一个信号,然后再次尝试原子性acquire,如果失败了就阻塞。     *                    * CANCELLED(1):  这个结点由于超时或中断已被取消。结点从不离开这种状态。尤其是,     *                 这种状态的线程从不再次阻塞。     *     * CONDITION(-2): 这个结点当前在一个条件队列上。它将不会用于sync队列的结点,     *               直到被转移,在那时,结点的状态将被设为0.     *              这个值在这里的使用与其他字段的使用没有关系,仅仅是简化结构。     *                    * PROPAGATE(-3): releaseShared应该传递给其他结点。这是在doReleaseShared里设置     *                 (仅仅是头结点)以确保传递继续,即使其他操作有干涉。     *     * 0:             非以上任何值。     *     * 值是组织为数字的用以简化使用。非负值表示结点不需要信号。这样,大部分代码不需要     * 检查特定的值,只需要(检查)符号。     *     * 对于普通同步结点,字段初始化为0;对于条件结点初始化为CONDITION(-2)。     * 通过CAS操作修改(或者,当允许时,用无条件volatile写。)     */    volatile int waitStatus;    /*     * 连接到当前结点/线程依赖的用来检查等待状态的前驱结点。     * 在进入队列时赋值,只在出队列时置为空(为了GC考虑)。     * 根据前驱结点的取消,我们使查找一个非取消结点的while循环短路,这个总是会退出,     * 因为头结点从不会是取消了的:一个结点成为头只能是一次成功的acquire操作结果。     *     * 一个取消了的线程从不会在获取操作成功,线程只能取消自己,不能是其他结点。     */    volatile Node prev;    /*     * 连接到当前结点/线程释放时解除阻塞的后续结点。     * 在入队列时赋值,在绕过已取消前驱节点时调整,出队列时置为空(for GC)。     * 入队操作不会给前驱结点的next字段赋值,直到附件后(把新节点赋值给队列的tail属性?),     * 所以看到next字段为空不一定表示它就是队列的尾结点。然而,如果next字段看起来是空,     * 我们可以从tail向前遍历进行双重检查。     * 被取消了的结点的next字段被设置为指向它自己而不是空,这让isOnSyncQueue变得容易。     */    volatile Node next;    /*     * 列队在这个结点的线程,在构造时初始化,用完后置空。     */    volatile Thread thread;    /*     * 连接到下一个在条件上等待的结点或是特殊的值SHARED。     * 因为条件队列只在独占模式下持有时访问,我们只需要一个简单的链表队列来持有在条件上等待的结点。     * 他们然后被转移到队列去re-acquire。     * 因为条件只能是独占的,我们通过用一个特殊的值来表明共享模式 来节省一个字段。     */    Node nextWaiter;    Node() {    // Used to establish initial head or SHARED marker    }    Node(Thread thread, Node mode) {     // Used by addWaiter        this.nextWaiter = mode;        this.thread = thread;    }    Node(Thread thread, int waitStatus) { // Used by Condition        this.waitStatus = waitStatus;        this.thread = thread;    }}

接下来我们就来看下其主要操作的主要逻辑。

3 enqueue

由于AQS队列节点包括pred和next两个指针,无法通过一次原子操作更新两个指针。所以添加结点到队列的操作最重要的是要保证:即使添加的CAS操作失败了,也不能影响队列结点现有的连接关系。

对于新加结点:

  • 在CAS之前指向它的预期前驱
  • CAS成功之后再更新预期前驱的后继指针。

在步骤1成功之后、步骤2完成之前,其他线程通过结点的 “next” 连接可能看到“尾结点”(即代码里的 pred)的 “next” 为空,但其实队列里已经加入新的结点,这也是为什么通过 “next” 连接遍历队列时碰到后继为空的,必须从原子地更新的 “tail” 结点向后遍历。

private Node addWaiter(Node mode) {    Node node = new Node(Thread.currentThread(), mode);   // 尝试enq的快速路径;失败后回退到完整的enq。    Node pred = tail;    if (pred != null) {      // 把新结点的前驱指向pred,必须在下面的CAS完成之前设置,      // 这样确保一旦CAS成功后,从tail向后遍历是ok的。        node.prev = pred;// 步骤 1        if (compareAndSetTail(pred, node)) {  //CAS             // 新节点成功进入队列             // 前驱结点的next字段指向新结点,建立完整的连接。            pred.next = node; // 步骤 2            return node;        }    }    enq(node);    return node;}private Node enq(final Node node) {    for (;;) {        Node t = tail;        if (t == null) { // 队列是空,必须初始化。            if (compareAndSetHead(new Node())) // 原子地设置头结点                tail = head; // 尾结点也指向头结点        } else {            node.prev = t;            if (compareAndSetTail(t, node)) {  // 步骤 1                t.next = node; // 步骤 2 // 在把新结点设置为tail后才能更新前驱的next字段,这样,即使CAS失败了也不会影响原来的连接关系。                return t;            }        }    }}

4 acquire

acquire方法不提供绝对公平的保证,因为现在在加入队列之前先进行tryAcquire操作,如果这个线程先于头结点锁定,那么头结点就只能继续等待了。这种情形称为闯入。

这个acquire之所以先尝试获取是为了在无竞争的情况下提高性能,并可以实现非公平的获取。如果要保证绝对的公平性,则可以在子类实现的tryAcquire方法里判断当前线程是否是头结点,是则尝试获取,不是则直接返回false。

// 以独占模式获取public final void acquire(int arg) {    if (!tryAcquire(arg) && // 首先尝试获取        acquireQueued(addWaiter(Node.EXCLUSIVE), arg))      // 失败后加入等待队列,再从队列里再次尝试获取;成功获取后才返回,      // 返回的boolean表示线程是否曾经被中断。      // 在acquireQueued方法里,线程可能被反复park、unpark,直到获取锁。      selfInterrupt(); // 重新设置中断状态位,是否执行取决于acquireQueued的返回值}final boolean acquireQueued(final Node node, int arg) {    boolean failed = true;    try {        boolean interrupted = false; // 线程是否曾被中断是由这个变量记录的。        for (;;) { // 死循环,用于acquire失败后重试            final Node p = node.predecessor();            if (p == head && tryAcquire(arg)) {// 前驱是头结点,继续尝试获取                setHead(node);                p.next = null; // help GC                failed = false;                return interrupted;            }            // 检测是否需要等待,如果需要,则park当前线程            // 只有前驱在等待时才进入等待,否则继续重试            if (shouldParkAfterFailedAcquire(p, node) &&                parkAndCheckInterrupt()) // 线程进入等待,需要其他线程来唤醒这个线程以继续执行                interrupted = true;   // 只要线程在等待过程中被中断过一次就会记录下来        }    } finally {        if (failed)             // acquire失败,取消acquire            cancelAcquire(node);    }}/* * 这个方法是信号控制的核心。检查和更新没有成功获取的结点的状态。 */private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {    int ws = pred.waitStatus;    if (ws == Node.SIGNAL)      // 前驱结点也在等待,说明这是一个稳定的等待状态。        return true ;    if (ws > 0) {      // 前驱结点已取消,向前遍历直到找到一个非取消结点。        do {            node.prev = pred = pred.prev;        } while (pred.waitStatus > 0);        // 把找到的结点的后继指向node,那么当前pred与node之间的已取消结点就不再被引用了,可以被垃圾回收。        pred.next = node;    } else {      // 前驱的状态必是 0 或 PROPAGATE之一。表明需要一个信号,但不park先。      // 调用者需要重试来确保它在park之前没法获取。        compareAndSetWaitStatus(pred, ws, Node.SIGNAL);    }    return false;}private final boolean parkAndCheckInterrupt() {       // park当前执行线程, 其他线程unpark这个线程后继续执行    LockSupport.park( this);    return Thread.interrupted();}

5 release

public final boolean release(int arg) {  if (tryRelease(arg)) {    Node h = head;    if (h != null && h.waitStatus != 0)      unparkSuccessor(h);    return true;  }  return false;}private void unparkSuccessor(Node node) {    /*     * 如果status是负的(比如,可能需要信号)尝试清除预期的信号。     * 如果这失败了或status被其他等待线程修改也是没关系的。     */    int ws = node.waitStatus;    if (ws < 0)        compareAndSetWaitStatus(node, ws, 0);    /*     * 准备unpark的线程在后继里持有,一般就是下一个结点。     * 但如果被取消或是空,从tail向后遍历来找到实际的非取消后继。     */    Node s = node.next;    if (s == null || s.waitStatus > 0) {      // 没有直接后继或直接后继不需要通知        s = null;        // 从tail向后遍历,查找需要通知的结点        for (Node t = tail; t != null && t != node; t = t.prev)             // 找到一个后不跳出循环是为了找到最老的需要通知的结点。            if (t.waitStatus <= 0)                s = t;    }    if (s != null) // 结点不为null,唤醒后继的等待线程        LockSupport.unpark(s.thread);}
阅读全文
0 0