JAVA集合4-HashMap

介绍

HashMap 它实现了 Map 接口，提供了键值对的存储和检索功能。HashMap 的底层数据结构是基于哈希表实现的,JDK7 是数组+链表，JDK8 是数组+链表+红黑树。其中有两个重要的参数：

容量
负载因子

容量的默认大小是 16，负载因子是 0.75，当 HashMap 的 size > 16*0.75 时就会发生扩容(容量和负载因子都可以自由调整)。

哈希表：HashMap 的核心是一个哈希表，它是一个数组，数组的每个元素称为桶（bucket），每个桶可以存储一个链表或红黑树结构。桶的数量通常是HashMap的容量（capacity），而每个桶中可以存放多个键值对。

哈希算法：HashMap 使用键的哈希码来确定键值对在哈希表中的存储位置。哈希码通过键的hashCode()方法生成，然后通过哈希函数（通常是对数组长度取模）将哈希码映射到具体的桶索引上。

解决哈希冲突：由于不同的键可能会生成相同的哈希码（哈希冲突），所以需要在同一个桶中存储多个键值对。HashMap 使用链表和红黑树来解决哈希冲突：

当桶中的元素较少时，使用链表来存储键值对。
当链表长度达到一定阈值（通常为8）时，将链表转换为红黑树，以提高检索效率。
当红黑树的节点数量减少到较小阈值以下时，将红黑树转换为链表，以节省空间。

扩容与重新哈希：当 HashMap 中的元素数量达到负载因子（load factor）与容量的乘积时，会触发扩容操作。负载因子是一个介于0和1之间的值，用于表示哈希表的填充程度。扩容操作会创建一个新的数组，将所有键值对重新插入到新的哈希表中。扩容操作比较耗时，因为它需要重新计算所有键的哈希码，并重新分配存储位置。

迭代顺序：HashMap 中的键值对存储顺序是不确定的，它不保证键值对的顺序与插入顺序相同。这是因为HashMap的存储位置是由键的哈希码决定的，而不是插入顺序。

put 方法

首先会将传入的 Key 做 hash 运算计算出 hashcode,然后根据数组长度取模计算出在数组中的 index 下标。

由于在计算中位运算比取模运算效率高的多，所以 HashMap 规定数组的长度为 2^n 。这样用 2^n - 1 做位运算与取模效果一致，并且效率还要高出许多。

由于数组的长度有限，所以难免会出现不同的 Key 通过运算得到的 index 相同，这种情况可以利用链表来解决，HashMap 会在 table[index]处形成链表，采用头插法将数据插入到链表中。

get 方法

get 和 put 类似，也是将传入的 Key 计算出 index ，如果该位置上是一个链表就需要遍历整个链表，通过 key.equals(k) 来找到对应的元素。

遍历方式

复制代码

 Iterator<Map.Entry<String, Integer>> entryIterator = map.entrySet().iterator();
        while (entryIterator.hasNext()) {
            Map.Entry<String, Integer> next = entryIterator.next();
            System.out.println("key=" + next.getKey() + " value=" + next.getValue());
        }

Iterator<String> iterator = map.keySet().iterator();
        while (iterator.hasNext()){
            String key = iterator.next();
            System.out.println("key=" + key + " value=" + map.get(key));

        }

map.forEach((key,value)->{
    System.out.println("key=" + key + " value=" + value);
});

强烈建议使用第一种 EntrySet 进行遍历。

第一种可以把 key value 同时取出，第二种还得需要通过 key 取一次 value，效率较低, 第三种需要 JDK1.8 以上，通过外层遍历 table，内层遍历链表或红黑树。

notice

在并发环境下使用 HashMap 容易出现死循环。

并发场景发生扩容，调用 resize() 方法里的 rehash() 时，容易出现环形链表。这样当获取一个不存在的 key 时，计算出的 index 正好是环形链表的下标时就会出现死循环。

所以 HashMap 只能在单线程中使用，并且尽量的预设容量，尽可能的减少扩容。

在 JDK1.8 中对 HashMap 进行了优化：当 hash 碰撞之后写入链表的长度超过了阈值(默认为8)并且 table 的长度不小于64(否则扩容一次)时，链表将会转换为红黑树。

假设 hash 冲突非常严重，一个数组后面接了很长的链表，此时重新的时间复杂度就是 O(n) 。

如果是红黑树，时间复杂度就是 O(logn) 。

大大提高了查询效率。

多线程场景下推荐使用 ConcurrentHashMap。