HashMap源码分析笔记

底层：数组+链表+红黑树

重点

扰动函数

java 复制代码

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

对key的哈希值进行扰动：高16位不变，低16位和高16位做异或运算，赋值给低16位。目的是在数组长度较短的时候减少冲突。

存放位置的计算
根据key的哈希值，计算出在数组中存放的位置。

java 复制代码

hash & (length - 1)

实际就是取模，hash%length，计算机中直接求余效率不如位移运算，源码中做了优化hash&(length-1)。要想保证hash%length==hash&(length-1)，那么length必须是2的n次方；

添加元素的方法

java 复制代码

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict)

扩容方法

java 复制代码

final Node<K,V>[] resize()

当哈希表中的元素个数达到了扩容阈值threshold，就进行扩容。
为什么需要扩容？当元素越来越多的时候，hashMap的查找速度就从O(1)升到O(n)，导致链化严重。为了解决冲突带来的查询效率的下降，因此需要扩容。
1. 初始化扩容。
  
  ①没有指定capacity。则给定默认值capacity = 16和threshold = 12。如果调用new HashMap(); 此时，哈希表的容量和扩容阈值都为0。则给他们赋初值。没有指定大小，默认为16。扩容阈值默认16*0.75。其中，0.75是默认的负载因子。
  
  ②指定了capacity。通过tableSizeFor方法获取第一个大于等于capacity的2的次方数，并赋值给threshold。分配内存时，通过threshold 大小分配内存。（capacity 哈希表的长度，没有分配内存时，长度为0。）
1. 非初始化扩容。threshold和数组大小都变为原来的2倍。

对链表进行分解

扩容后数组的长度是原来的2倍。链表的元素需要重新计算存放位置。链表会被分为两个部分。

一部分位于原来位置，另一部分转移到新位置。新位置 = 老位置 + 老数组长度。

tableSizeFor方法

java 复制代码

// 此方法核心功能就是求出，大于等于输入长度的2次幂的值
// 如输出：8，输出为8
// 如输出：9，输出为16
static final int tableSizeFor(int cap) {
    int n = cap - 1;
    n |= n >>> 1; //  n = n | (n >>> 1);
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

树化条件

①哈希桶中的元素数量>=8

②哈希表大小>=64
取消树化条件

哈希桶中的元素数量<=6