HashTable和ConcurrentHashMap是如何实现线程安全的？

在说HashTable和ConcurrentHashMap线程安全问题之前我们先看一段代码：

csharp 复制代码

public class Safe {

    private int count = 0;

    private  void  add(){
        for(int i=0 ; i<100 ; i++){
            try {
                Thread.sleep(1);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            count++;
        }
    }

    public static void main(String[] args) throws InterruptedException {
        Safe safe = new Safe();
        new Thread(()->safe.add()).start();
        new Thread(()->safe.add()).start();

        Thread.sleep(1000);
        System.out.println(safe.count);
    }
}

类Safe中仅有一个count的成员变量初始值为0，现在两个线程访问这个Safe对象，对count的值进行各累加100次。按照正常情况算出的结果应该为200，但是实际执行的结果却并不是：

可以看到执行的结果很不稳定，有的时候和预期值一样，有的时候却会不一样，这就是多线程下成员变量的线程不安全问题。

那么，我们再将该代码改变一下如下：

csharp 复制代码

public class Safe {

    private int count = 0;

    private synchronized void  add(){
        for(int i=0 ; i<100 ; i++){
            count++;
            try {
                Thread.sleep(1);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }

    public static void main(String[] args) throws InterruptedException {
        Safe safe = new Safe();
        new Thread(()->safe.add()).start();
        new Thread(()->safe.add()).start();

        Thread.sleep(1000);
        System.out.println(safe.count);
    }
}

执行结果

在add方法上添加synchronized关键字，将该方法体设为线程同步块，方法体每次只能有一个线程执行，这样就有效的解决了线程安全的问题。

1、HashTable如何实现线程安全

这里我们看一下HashTable在对数据操作的各个方法的源码

1）size()方法

2）isEmpty()方法

3） keys()方法

4）contains()方法

5）get(key) 方法

6）put方法

7）clear方法

从这些方法中，我们可以看到这些对容器中数据进行操作的方法都被synchronized关键字修饰，和最开始的案例一样，这种jdk自带的内置锁可以使得被synchronized关键字修饰的方法体和代码块一次只能被一个线程执行，也就保证了线程安全的问题。

但是为什么Jdk还会添加ConcurrentHashMap这个线程安全的类呢?

让我们看看HashTable，HashTable本身是个容器，这也就说明了HashTable本身可以不断的放大，试想一下，HashTable如果本身如果存在1000个元素，那么在get()方法中就会将这1000个元素完全锁住，期间其他任何线程都得等待。这样就会造成容器越大，对容器数据操作的效率将越低。

那么，让我们来看看ConcurrentHashMap是如何实现线程安全的，它能实现高效率的线程安全吗？

这里我们就不看ConcurrentHashMap的源码了，简单说说线程安全的原理，其实ConcurrentHashMap实现线程安全也是通过synchronized关键字来控制代码同步来实现的，不同于HashTable的是ConcurrentHashMap在线程同步上更加细分化，它不会像HashTable那样一把包揽的将所有数据都锁住。

采用分段锁思路

我们都知道ConcurrentHashMap的底层数据结构实现原理其实和HashMap没什么两样，都是数组+链表+红黑树。那么我们就从HashMap入手，来理解。

具体HashMap的实现原理剖析请看个人博客：HashMap底层原理简单剖析_hashmap为什么会用hashcode获取索引_码眼的博客-CSDN博客

怎么将HashMap数据结构使用分段锁的思想进行细分化。在jdk1.7及以前，是这样实现的：

比如容器HashMap中存在1000个元素，各个元素都放置到HashMap数组的链表或者红黑数中，最后得到的数组大小可能只有128，ConcurrentHashMap会根据这128个数组，对其分段，比如以16个数组为一段，可以分为8段。在实际获取元素，添加元素时，会根据元素的索引(如何获取元素在HashMap数组中的索引请看HashMap底层原理简单剖析_hashmap为什么会用hashcode获取索引_码眼的博客-CSDN博客)找到该元素所处的段位，然后只将该段位锁住，并不影响其他段位的数据操作。这样如果按照HashTable的效率为基本单位来计算，ConcurrentHashMap在jdk1.7及以前的效率会提高8倍，当然数据量越大，提高的效率将越多。

jdk1.8后，ConcurrentHashMap依旧使用分段锁的思想来实现线程安全，不同于jdk1.7及以前，jdk1.8将锁的粒度更加细分化，以每个数组索引为锁来进行实现。比如HashMap数组中长度有128，那么就会存在128个锁将每个索引锁住。这样相比于jdk1.7之前在效率上有了很大的改进。

总结一下

HashTable和ConcurrentHashMap都是线程安全的容器。

HashTable: 线程安全，效率和容器的大小成正比。容器数据量越大，效率越慢

ConcurrentHashMap: 线程安全，效率相对于不如HashMap,但是和HashTable相比，效率得到很大的提升。

综合考虑，如果使用线程安全容器，推荐使用ConcurrentHashMap