Java HashMap全面解析

HashMap 是 Java 集合框架中最常用的键值对(Key-Value)存储容器;同时在安卓开发中,HashMap 是本地数据存储、临时缓存的核心工具。接下来我们来看看 HashMap 的定义、底层结构、核心算法、扩容机制、线程安全问题。

一、HashMap定义

HashMap 是java.util包下的实现类,实现了Map<K,V>接口,基于哈希表实现键值对存储,核心特征:

  • 存储规则:键(Key)唯一,值(Value)可重复;键和值都允许为null;
  • 无序性:不保证插入顺序与遍历顺序一致;
  • 非线程安全:HashMap 为了机制的性能,所有核心操作都没有任何同步或原子性保障,多线程并发时应使用 ConcurrentHashMap 或 synchronizedMap;
  • 性能:增删改查平均时间复杂度为O(1),哈希冲突严重时退化为O(n)(JDK1.8 后优化为O(logn)

二、HashMap 底层数据结构

在JDK1.8之后 HashMap 的底层结构经历了关键优化,目的是解决"哈希冲突导致链表过长"的性能问题。

JDK1.7:数组(桶)+ 链表

JDK1.8之前 HashMap 底层是数组和链表结合在一起使用的。HashMap 通过 key 的 hashcode 经过扰动函数(用来优化哈希值的分布,减少碰撞)处理后得到 hash值,然后通过寻址算法判断当前元素存放的位置(前提是数组长度 n 必须是 2 的幂次)。

  • 数组(Hash 桶):核心存储结构,数组的每个元素是一个链表的头节点,数组下标通过 Key 的哈希值计算得到;
  • 链表:解决哈希冲突(不同 Key 计算出相同下标),冲突的键值对以链表形式挂在同一个数组下标下。
  • 缺点:当链表过长时,查询效率从O(1)退化为O(n)

JDK1.8:数组(桶)+ 链表 + 红黑树

JDK1.8之后在解决哈希冲突时有了较大的变化,当链表长度大于8且数组总长度大于64时,链表转化为红黑树,查询复杂度从O(n)降至O(logn)

当红黑树节点数减少到6时,会重新退化为链表。

三、HashMap 的基本使用

HashMap 的 API 简单易用,核心操作包括「增、删、改、查、遍历」,简单示例如下:

java 复制代码
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

public class HashMapBasicUsage {
    public static void main(String[] args) {
        // 创建HashMap:指定键值类型,默认初始容量16,负载因子0.75
        HashMap<String, Integer> userScore = new HashMap<>();
        // 也可指定初始容量和负载因子:HashMap<String, Integer> map = new HashMap<>(32, 0.75f);

        // 新增元素(put)
        userScore.put("张三", 90);
        userScore.put("李四", 85);
        userScore.put("王五", 95);
        userScore.put(null, 0); // 键允许为null
        userScore.put("赵六", null); // 值允许为null

        // 修改元素(重复put同一键,覆盖值)
        userScore.put("李四", 88);

        // 查询元素
        // get(key):存在返回值,不存在返回null
        Integer zhangSanScore = userScore.get("张三");
        System.out.println("张三的分数:" + zhangSanScore); // 输出:90

        // containsKey(key):判断键是否存在
        boolean hasWangWu = userScore.containsKey("王五");
        System.out.println("是否包含王五:" + hasWangWu); // 输出:true

        // containsValue(value):判断值是否存在(效率低,需遍历)
        boolean hasScore95 = userScore.containsValue(95);
        System.out.println("是否有95分:" + hasScore95); // 输出:true

        // 删除元素
        userScore.remove(null); // 删除键为null的元素
        userScore.remove("赵六"); // 删除键为赵六的元素

        // 遍历HashMap(三种常用方式)
        System.out.println("\n=== 遍历方式1:entrySet(推荐,效率最高)===");
        for (Map.Entry<String, Integer> entry : userScore.entrySet()) {
            System.out.println("键:" + entry.getKey() + ",值:" + entry.getValue());
        }

        System.out.println("\n=== 遍历方式2:keySet + get(效率低,需二次哈希)===");
        for (String key : userScore.keySet()) {
            System.out.println("键:" + key + ",值:" + userScore.get(key));
        }

        System.out.println("\n=== 遍历方式3:迭代器(支持删除)===");
        Iterator<Map.Entry<String, Integer>> iterator = userScore.entrySet().iterator();
        while (iterator.hasNext()) {
            Map.Entry<String, Integer> entry = iterator.next();
            if (entry.getValue() >= 90) {
                System.out.println("高分用户:" + entry.getKey());
                // 遍历中删除元素,只能用迭代器的remove(否则抛ConcurrentModificationException)
                // iterator.remove();
            }
        }

        // 其他常用方法
        System.out.println("\nHashMap大小:" + userScore.size()); // 输出:3
        userScore.clear(); // 清空所有元素
        System.out.println("清空后是否为空:" + userScore.isEmpty()); // 输出:true
    }
}

四、HashMap的核心算法

哈希算法

我们只看JDK1.8的 hash 算法:

java 复制代码
static final int hash(Object key) {
    int h;
    // 1. key为null时,哈希值为0;2. 非null时,取hashCode()并与高16位异或
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

将 Key 的 hashCode 高 16 位与低 16 位异或,让高位特征融入低位 ------ 因为数组下标计算只用到低位,这样能减少哈希冲突。

数组下标计算

就是之前提到的寻址算法,实现如下:

java 复制代码
index = hash & (length - 1);
  • hash & (length - 1)length为 2 的幂时,等价于对 length 的取模运算,但位运算比取模快得多(CPU 原生支持);
  • length是 2 的幂保证length - 1的二进制全为 1,这样hash & (length - 1)能充分利用哈希值的低位,分散元素分布,减少冲突。

哈希冲突解决

当两个 Key 计算出相同下标时,HashMap 采用拉链法解决:

  • JDK1.7:新元素以头插法插入链表(扩容时可能导致链表循环,线程不安全);
  • JDK1.8:新元素以尾插法插入链表(解决头插法的循环问题,仍非线程安全);
  • 当链表长度≥8 且数组长度≥64 时,链表转为红黑树,提升查询效率。

五、HashMap 扩容机制

当 HashMap 新增元素后里面的元素个数 > 阈值时,就会触发扩容。

扩容相关的参数:

  • initialCapacity:初始容量;
  • loadFactor:负载因子(扩容阈值比例),默认为0.75;
  • threshold:扩容阈值,值为容量×负载因子。

扩容过程:

  1. 创建新数组,容量 = 旧容量 × 2,阈值 = 旧阈值 × 2;

  2. 遍历原数组中的每一个桶(Bucket),根据桶内结点的状态进行分类处理:

  • 空桶:直接跳过;
  • 单节点(无冲突):重新计算下标newTab[e.hash & (newCap - 1)] = e
  • 链表:判断e.hash & oldCap,为0时元素下标不变,否则下标 = 旧下标 + oldCap;
  • 红黑树:先拆分(逻辑同链表,拆分成两个子树),如果拆分后的子树节点数 ≤ 6,则将该树转回普通链表,否则将重新修剪红黑树放入对应位置。
  1. 将内部成员变量 table 指向这个新数组,新数组替代旧数组,旧数组等待下一次 GC 回收。
相关推荐
froginwe112 小时前
Python3与MySQL的连接:使用mysql-connector
开发语言
rannn_1112 小时前
【苍穹外卖|Day4】套餐页面开发(新增套餐、分页查询、删除套餐、修改套餐、起售停售)
java·spring boot·后端·学习
杜子不疼.2 小时前
PyPTO:面向NPU的高效并行张量编程范式
开发语言
qq_12498707532 小时前
基于JavaWeb的大学生房屋租赁系统(源码+论文+部署+安装)
java·数据库·人工智能·spring boot·计算机视觉·毕业设计·计算机毕业设计
lly2024062 小时前
C# 结构体(Struct)
开发语言
短剑重铸之日2 小时前
《设计模式》第十一篇:总结
java·后端·设计模式·总结
YMWM_2 小时前
python3继承使用
开发语言·python
Once_day3 小时前
C++之《程序员自我修养》读书总结(1)
c语言·开发语言·c++·程序员自我修养