Hash表以及put方法源码的分析

1.什么是Hash表

Hash表(Hash Table),也被称为散列表,是一种根据关键码值(Key value)而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数称为散列函数(Hash Function),存放记录的数组称为散列表

2.源码解读

  1. 首先执行.put方法时会调用
java 复制代码
    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

通过hash方法,用key生成一个哈希值

  1. 然后执行putVal方法实现put

pyuval方法:

java 复制代码
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

resize方法:

java 复制代码
final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        int oldThr = threshold;
        int newCap, newThr = 0;
        if (oldCap > 0) {
            if (oldCap >= MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

解读:jdk1.8采用先插入再扩容的形式

第一次插入值和插入的数据位置为null:

1.首先判断table也就是 HashMap 是否已经初始化。当前这个hash数组是否为空,如果是空的那就对当前数组,进通过resize方法进行初始化操作

2.初始化操作:初始化就是一个特定容量的数组(默认是16),并设置负载因子(默认为0.75),将创建好的新数组返回给table

3.通过 "p = tab[i = (n - 1) & hash]) == null" 判断当前插入的数据位置是否为null,此时第一次插入为null,那么就插入进来,此时记录hash表中数据加+1并根据判断是否大于阈值,判断是否需要扩容数组

之后插入值和插入的数据位置不为null:

  1. 也是会判断1,2,

2.通过 "p = tab[i = (n - 1) & hash]) == null" 判断当前插入的数据位置是否为null,此时不为null,判断是否属于红黑树结构,为红黑树结构按照红黑树的方式插入,如果红黑树节点个数<=6就会进行退化,退化成链表

  1. 插入位置不为null,是链表的形式,通过尾插法插入数据,但是如果遍历时,找到了相同的key,则直接替换链表中的数据即可,如果当数组长度>=64 并且链表长度》=8 将链表转为红黑树

4.此时记录hash表中数据加+1(修改不会加1)并根据判断是否大于阈值,判断是否需要扩容数组

达到阈值,进行扩容的操作:

1.当达到阈值时,数组按照将原数组的长度"<<1"左移1位(也就是*2操作),

2.此刻随着数组的变长,数组中的数组也要变化

遍历原数组

2.1 首先如果该元素下面没有链表或红黑树只是单纯的节点,那么就"newTab[e.hash & (newCap - 1)] = e;"通过将该元素的hash值和新数组长度-1的做&运算(这个是通过将哈希值对数组长度进行取模(%)操作来实现的,但Java中通常使用位运算 &(与操作)和数组长度减一的结果来实现相同的效。)判断出新元素的位置

2.2 先如果该元素下面是红黑树

则执行这个((TreeNode<K,V>)e).split(this, newTab, j, oldCap);

2.3 先如果该元素下面是一个链表结构

根据左移后的最高位上的值来判断,如果是老值(为0)就不动。因为(该元素的hash值上一位是0和原数组的长度-1做&)和(该元素的hash值上一位是0和当前数组的长度-1做&),获取位置的时候只与老数组长度的最高位,当前元素相对应的位数是否为1有关,如果位1则需要改变位置,如果不为1则不需要变化,且变换的位置就是当前元素的位置+老数组的长度,此刻很清晰了,找到相对应的位数是否为1组成2个新链表,由于如果为1变化的位置是新创建的所以为null,此时直接插入即可,把不为1的链表,按照原来的位置插入即可(由于原链表并不满足红黑树条件,所以拆分的两个链表在插入的时候,并不需要考虑到转换红黑树的问题)

相关推荐
巫师不要去魔法部乱说1 小时前
PyCharm专项训练4 最小生成树算法
算法·pycharm
IT猿手1 小时前
最新高性能多目标优化算法:多目标麋鹿优化算法(MOEHO)求解GLSMOP1-GLSMOP9及工程应用---盘式制动器设计,提供完整MATLAB代码
开发语言·算法·机器学习·matlab·强化学习
阿七想学习1 小时前
数据结构《排序》
java·数据结构·学习·算法·排序算法
王老师青少年编程2 小时前
gesp(二级)(12)洛谷:B3955:[GESP202403 二级] 小杨的日字矩阵
c++·算法·矩阵·gesp·csp·信奥赛
Kenneth風车2 小时前
【机器学习(九)】分类和回归任务-多层感知机(Multilayer Perceptron,MLP)算法-Sentosa_DSML社区版 (1)111
算法·机器学习·分类
eternal__day2 小时前
数据结构(哈希表(中)纯概念版)
java·数据结构·算法·哈希算法·推荐算法
APP 肖提莫2 小时前
MyBatis-Plus分页拦截器,源码的重构(重构total总数的计算逻辑)
java·前端·算法
OTWOL3 小时前
两道数组有关的OJ练习题
c语言·开发语言·数据结构·c++·算法
qq_433554543 小时前
C++ 面向对象编程:递增重载
开发语言·c++·算法
带多刺的玫瑰3 小时前
Leecode刷题C语言之切蛋糕的最小总开销①
java·数据结构·算法