1.什么是Hash表
Hash表(Hash Table),也被称为散列表,是一种根据关键码值(Key value)而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数称为散列函数(Hash Function),存放记录的数组称为散列表
2.源码解读
- 首先执行.put方法时会调用
javapublic V put(K key, V value) { return putVal(hash(key), key, value, false, true); }
通过hash方法,用key生成一个哈希值
- 然后执行putVal方法实现put
pyuval方法:
javafinal V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }
resize方法:
javafinal Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold } else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; else { // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null; if (e.next == null) newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // preserve order Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }
解读:jdk1.8采用先插入再扩容的形式
第一次插入值和插入的数据位置为null:
1.首先判断table也就是 HashMap 是否已经初始化。当前这个hash数组是否为空,如果是空的那就对当前数组,进通过resize方法进行初始化操作
2.初始化操作:初始化就是一个特定容量的数组(默认是16),并设置负载因子(默认为0.75),将创建好的新数组返回给table
3.通过 "p = tab[i = (n - 1) & hash]) == null" 判断当前插入的数据位置是否为null,此时第一次插入为null,那么就插入进来,此时记录hash表中数据加+1并根据判断是否大于阈值,判断是否需要扩容数组
之后插入值和插入的数据位置不为null:
- 也是会判断1,2,
2.通过 "p = tab[i = (n - 1) & hash]) == null" 判断当前插入的数据位置是否为null,此时不为null,判断是否属于红黑树结构,为红黑树结构按照红黑树的方式插入,如果红黑树节点个数<=6就会进行退化,退化成链表
- 插入位置不为null,是链表的形式,通过尾插法插入数据,但是如果遍历时,找到了相同的key,则直接替换链表中的数据即可,如果当数组长度>=64 并且链表长度》=8 将链表转为红黑树
4.此时记录hash表中数据加+1(修改不会加1)并根据判断是否大于阈值,判断是否需要扩容数组
达到阈值,进行扩容的操作:
1.当达到阈值时,数组按照将原数组的长度"<<1"左移1位(也就是*2操作),
2.此刻随着数组的变长,数组中的数组也要变化
遍历原数组
2.1 首先如果该元素下面没有链表或红黑树只是单纯的节点,那么就"newTab[e.hash & (newCap - 1)] = e;"通过将该元素的hash值和新数组长度-1的做&运算(这个是通过将哈希值对数组长度进行取模(%)操作来实现的,但Java中通常使用位运算 &(与操作)和数组长度减一的结果来实现相同的效。)判断出新元素的位置
2.2 先如果该元素下面是红黑树
则执行这个((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
2.3 先如果该元素下面是一个链表结构
根据左移后的最高位上的值来判断,如果是老值(为0)就不动。因为(该元素的hash值上一位是0和原数组的长度-1做&)和(该元素的hash值上一位是0和当前数组的长度-1做&),获取位置的时候只与老数组长度的最高位,当前元素相对应的位数是否为1有关,如果位1则需要改变位置,如果不为1则不需要变化,且变换的位置就是当前元素的位置+老数组的长度,此刻很清晰了,找到相对应的位数是否为1组成2个新链表,由于如果为1变化的位置是新创建的所以为null,此时直接插入即可,把不为1的链表,按照原来的位置插入即可(由于原链表并不满足红黑树条件,所以拆分的两个链表在插入的时候,并不需要考虑到转换红黑树的问题)