CAS详解

什么叫CAS?

CAS,是 compare and swap 的缩写,即比较并交换。它是一种基于乐观锁的操作。它有三个操作数,内存值V,预期值A,更新值B。当且仅当A和V相同时,才会把V修改成B,否则什么都不做。之前说到AtomicInteger用到了CAS,那么先从这个类说起。看如下代码:

public static void main(String[] args){
        AtomicInteger atomicInteger = new AtomicInteger(5);
        System.out.println(atomicInteger.compareAndSet(5,50));
        System.out.println(atomicInteger.compareAndSet(5,100));
}

AtomicInteger有一个compareAndSet方法,有两个操作数,第一个是期望值,第二个是希望修改成的值。首先初始值是5,第一次调用compareAndSet方法的时候,将5拷贝回自己的工作空间,然后改成50,写回到主内存中的时候,它期望主内存中的值是5,而这时确实也是5,所以可以修改成功,主内存中的值也变成了50,输出true。第二次调用compareAndSet的时候,在自己的工作内存将值修改成100,写回去的时候,希望主内存中的值是5,但是此时是50,所以set失败,输出false。这就是比较并交换,也即CAS。

CAS的工作原理

简而言之,CAS工作原理就是UnSafe类自旋锁
1、UnSafe类:

UnSafe类在jdk的rt.jar下面的一个类,全包名是sun.misc.UnSafe。这个类大多数方法都是native方法。由于Java不能操作计算机系统,所以设计之初就留了一个UnSafe类。通过UnSafe类,Java就可以操作指定内存地址的数据。调用UnSafe类的CAS,JVM会帮我们实现出汇编指令,从而实现原子操作。现在就来分析一下AtomicInteger的getAndIncrement方法是怎么工作的。看下面的代码:

 public final int getAndIncrement() {
        return unsafe.getAndAddInt(this, valueOffset, 1);
 }

这个方法调用的是unsafe类的getAndAddInt方法,有三个参数。第一个表示当前对象,也就是你new 的那个AtomicInteger对象;第二个表示内存地址;第三个表示自增步伐。然后再点进去看看这个getAndAddInt方法。

public final int getAndAddInt(Object var1, long var2, int var4) {
        int var5;
        do {
            var5 = this.getIntVolatile(var1, var2);
        } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
        return var5;
    }

这里的val1就是当前对象,val2是内存地址,val4是1,也就是自增步伐。首先把当前对象主内存中的值赋给val5,然后进入while循环。判断当前对象此刻主内存中的值是否等于val5,如果是,就自增,否则继续循环,重新获取val5的值。这里的compareAndSwapInt方法就是一个native方法,这个方法汇编之后是CPU原语指令,原语指令是连续执行不会被打断的,所以可以保证原子性。

2、自旋锁:

所谓的自旋,其实就是上面getAndAddInt方法中的do while循环操作。当预期值和主内存中的值不等时,就重新获取主内存中的值,这就是自旋。

CAS的缺点

缺点有三个。
1、循环时间长,开销大。

synchronized是加锁,同一时间只能一个线程访问,并发性不好。而CAS并发性提高了,但是由于CAS存在自旋操作,即do while循环,如果CAS失败,会一直进行尝试。如果CAS长时间不成功,会给CPU带来很大的开销。

2、只能保证一个共享变量的原子性。

上面也看到了,getAndAddInt方法的val1是代表当前对象,所以它也就是能保证这一个共享变量的原子性。如果要保证多个,那只能加锁了。

3、引来的ABA问题。

  • 什么是ABA问题?

假设现在主内存中的值是A,现有t1和t2两个线程去对其进行操作。t1和t2先将A拷贝回自己的工作内存。这个时候t2线程将A改成B,刷回到主内存。此刻主内存和t2的工作内存中的值都是B。接下来还是t2线程抢到执行权,t2又把B改回A,并刷回到主内存。这时t1终于抢到执行权了,自己工作内存中的值的A,主内存也是A,因此它认为没人修改过,就在工作内存中把A改成了X,然后刷回主内存。也就是说,在t1线程执行前,t2将主内存中的值由A改成B再改回A。这便是ABA问题。看下面的代码演示(代码涉及到原子引用,请参考下面的原子引用的介绍):

class ABADemo {
   static AtomicReference<String> atomicReference = new AtomicReference<>("A");
   public static void main(String[] args){
          new Thread(() -> {
              atomicReference.compareAndSet("A","B");
              atomicReference.compareAndSet("B","A");
              },"t2").start();
          new Thread(() -> {
              try { 
                   TimeUnit.SECONDS.sleep(1);
              } catch (InterruptedException e) {
                   e.printStackTrace(); 
              }
              System.out.println(atomicReference.compareAndSet("A","C") 
                                           + "\t" + atomicReference.get());
              },"t1").start();
   }
}

这段代码执行结果是"true C",这就证明了ABA问题的存在。如果一个业务只管开头和结果,不管这个A中间是否变过,那么出现了ABA问题也没事。如果需要A还是最开始的那个A,中间不许别人动手脚,那么就要规避ABA问题。要解决ABA问题,先看下面的原子引用的介绍。

  • 原子引用:

JUC包下给我们提供了原子包装类,像AtomicInteger。如果我不仅仅想要原子包装类,我自己定义的User类也想具有原子操作,怎么办呢?JUC为我们提供了AtomicReference,即原子引用。看下面的代码:

@AllArgsConstructor
class User {
    int age;
    String name;

    public static void main(String[] args){
        User user = new User(20,"张三");
        AtomicReference<User> atomicReference = new AtomicReference<>();
        atomicReference.set(user);
    }
}

像这样,就把User类变成了原子User类了。

  • 解决ABA问题思路:

我们可以这个共享变量带上一个版本号。比如现在主内存中的是A,版本号是1,然后t1和t2线程拷贝一份到自己工作内存。t2将A改为B,刷回主内存。此时主内存中的是B,版本号为2。然后再t2再改回A,此时主内存中的是A,版本号为3。这个时候t1线程终于来了,自己工作内存是A,版本号是1,主内存中是A,但是版本号为3,它就知道已经有人动过手脚了。那么这个版本号从何而来,这就要说说AtomicStampedReference这个类了。

  • 带时间戳的原子引用(AtomicStampedReference):
    这个时间戳就理解为版本号就行了。看如下代码:

    class ABADemo {
    static AtomicStampedReference<String> atomicReference = new AtomicStampedReference<>("A", 1);
    public static void main(String[] args) {
    new Thread(() -> {
    try {
    TimeUnit.SECONDS.sleep(1);// 睡一秒,让t1线程拿到最初的版本号
    } catch (InterruptedException e) {
    e.printStackTrace();
    }
    atomicReference.compareAndSet("A", "B", atomicReference.getStamp(), atomicReference.getStamp() + 1);
    atomicReference.compareAndSet("B", "A", atomicReference.getStamp(), atomicReference.getStamp() + 1);
    }, "t2").start();
    new Thread(() -> {
    int stamp = atomicReference.getStamp();//拿到最开始的版本号
    try {
    TimeUnit.SECONDS.sleep(3);// 睡3秒,让t2线程的ABA操作执行完
    } catch (InterruptedException e) {
    e.printStackTrace();
    }
    System.out.println(atomicReference.compareAndSet("A", "C", stamp, stamp + 1));
    }, "t1").start();
    }
    }

初始版本号为1,t2线程每执行一次版本号加。等t1线程执行的时候,发现当前版本号不是自己一开始拿到的1了,所以set失败,输出false。这就解决了ABA问题。

总结:

1.什么是CAS? ------ 比较并交换,主内存值和工作内存值相同,就set为更新值。

2.CAS原理是什么? ------ UnSafe类和自旋锁。理解那个do while循环。

3.CAS缺点是什么? ------ 循环时间长会消耗大量CPU资源;只能保证一个共享变量的原子性操作;造成ABA问题。

4.什么是ABA问题? ------ t2线程先将A改成B,再改回A,此时t1线程以为没人修改过。

5.如何解决ABA问题?------ 使用带时间戳的原子引用。

相关推荐
qmx_0732 分钟前
HTB-Jerry(tomcat war文件、msfvenom)
java·web安全·网络安全·tomcat
为风而战40 分钟前
IIS+Ngnix+Tomcat 部署网站 用IIS实现反向代理
java·tomcat
编程零零七2 小时前
Python数据分析工具(三):pymssql的用法
开发语言·前端·数据库·python·oracle·数据分析·pymssql
技术无疆3 小时前
快速开发与维护:探索 AndroidAnnotations
android·java·android studio·android-studio·androidx·代码注入
2401_858286113 小时前
52.【C语言】 字符函数和字符串函数(strcat函数)
c语言·开发语言
铁松溜达py3 小时前
编译器/工具链环境:GCC vs LLVM/Clang,MSVCRT vs UCRT
开发语言·网络
everyStudy3 小时前
JavaScript如何判断输入的是空格
开发语言·javascript·ecmascript
C-SDN花园GGbond4 小时前
【探索数据结构与算法】插入排序:原理、实现与分析(图文详解)
c语言·开发语言·数据结构·排序算法
迷迭所归处5 小时前
C++ —— 关于vector
开发语言·c++·算法
架构文摘JGWZ6 小时前
Java 23 的12 个新特性!!
java·开发语言·学习