Java HashMap全面解析

HashMap 是 Java 集合框架中最常用的键值对(Key-Value)存储容器;同时在安卓开发中,HashMap 是本地数据存储、临时缓存的核心工具。接下来我们来看看 HashMap 的定义、底层结构、核心算法、扩容机制、线程安全问题。

一、HashMap定义

HashMap 是java.util包下的实现类,实现了Map<K,V>接口,基于哈希表实现键值对存储,核心特征:

  • 存储规则:键(Key)唯一,值(Value)可重复;键和值都允许为null;
  • 无序性:不保证插入顺序与遍历顺序一致;
  • 非线程安全:HashMap 为了机制的性能,所有核心操作都没有任何同步或原子性保障,多线程并发时应使用 ConcurrentHashMap 或 synchronizedMap;
  • 性能:增删改查平均时间复杂度为O(1),哈希冲突严重时退化为O(n)(JDK1.8 后优化为O(logn)

二、HashMap 底层数据结构

在JDK1.8之后 HashMap 的底层结构经历了关键优化,目的是解决"哈希冲突导致链表过长"的性能问题。

JDK1.7:数组(桶)+ 链表

JDK1.8之前 HashMap 底层是数组和链表结合在一起使用的。HashMap 通过 key 的 hashcode 经过扰动函数(用来优化哈希值的分布,减少碰撞)处理后得到 hash值,然后通过寻址算法判断当前元素存放的位置(前提是数组长度 n 必须是 2 的幂次)。

  • 数组(Hash 桶):核心存储结构,数组的每个元素是一个链表的头节点,数组下标通过 Key 的哈希值计算得到;
  • 链表:解决哈希冲突(不同 Key 计算出相同下标),冲突的键值对以链表形式挂在同一个数组下标下。
  • 缺点:当链表过长时,查询效率从O(1)退化为O(n)

JDK1.8:数组(桶)+ 链表 + 红黑树

JDK1.8之后在解决哈希冲突时有了较大的变化,当链表长度大于8且数组总长度大于64时,链表转化为红黑树,查询复杂度从O(n)降至O(logn)

当红黑树节点数减少到6时,会重新退化为链表。

三、HashMap 的基本使用

HashMap 的 API 简单易用,核心操作包括「增、删、改、查、遍历」,简单示例如下:

java 复制代码
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

public class HashMapBasicUsage {
    public static void main(String[] args) {
        // 创建HashMap:指定键值类型,默认初始容量16,负载因子0.75
        HashMap<String, Integer> userScore = new HashMap<>();
        // 也可指定初始容量和负载因子:HashMap<String, Integer> map = new HashMap<>(32, 0.75f);

        // 新增元素(put)
        userScore.put("张三", 90);
        userScore.put("李四", 85);
        userScore.put("王五", 95);
        userScore.put(null, 0); // 键允许为null
        userScore.put("赵六", null); // 值允许为null

        // 修改元素(重复put同一键,覆盖值)
        userScore.put("李四", 88);

        // 查询元素
        // get(key):存在返回值,不存在返回null
        Integer zhangSanScore = userScore.get("张三");
        System.out.println("张三的分数:" + zhangSanScore); // 输出:90

        // containsKey(key):判断键是否存在
        boolean hasWangWu = userScore.containsKey("王五");
        System.out.println("是否包含王五:" + hasWangWu); // 输出:true

        // containsValue(value):判断值是否存在(效率低,需遍历)
        boolean hasScore95 = userScore.containsValue(95);
        System.out.println("是否有95分:" + hasScore95); // 输出:true

        // 删除元素
        userScore.remove(null); // 删除键为null的元素
        userScore.remove("赵六"); // 删除键为赵六的元素

        // 遍历HashMap(三种常用方式)
        System.out.println("\n=== 遍历方式1:entrySet(推荐,效率最高)===");
        for (Map.Entry<String, Integer> entry : userScore.entrySet()) {
            System.out.println("键:" + entry.getKey() + ",值:" + entry.getValue());
        }

        System.out.println("\n=== 遍历方式2:keySet + get(效率低,需二次哈希)===");
        for (String key : userScore.keySet()) {
            System.out.println("键:" + key + ",值:" + userScore.get(key));
        }

        System.out.println("\n=== 遍历方式3:迭代器(支持删除)===");
        Iterator<Map.Entry<String, Integer>> iterator = userScore.entrySet().iterator();
        while (iterator.hasNext()) {
            Map.Entry<String, Integer> entry = iterator.next();
            if (entry.getValue() >= 90) {
                System.out.println("高分用户:" + entry.getKey());
                // 遍历中删除元素,只能用迭代器的remove(否则抛ConcurrentModificationException)
                // iterator.remove();
            }
        }

        // 其他常用方法
        System.out.println("\nHashMap大小:" + userScore.size()); // 输出:3
        userScore.clear(); // 清空所有元素
        System.out.println("清空后是否为空:" + userScore.isEmpty()); // 输出:true
    }
}

四、HashMap的核心算法

哈希算法

我们只看JDK1.8的 hash 算法:

java 复制代码
static final int hash(Object key) {
    int h;
    // 1. key为null时,哈希值为0;2. 非null时,取hashCode()并与高16位异或
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

将 Key 的 hashCode 高 16 位与低 16 位异或,让高位特征融入低位 ------ 因为数组下标计算只用到低位,这样能减少哈希冲突。

数组下标计算

就是之前提到的寻址算法,实现如下:

java 复制代码
index = hash & (length - 1);
  • hash & (length - 1)length为 2 的幂时,等价于对 length 的取模运算,但位运算比取模快得多(CPU 原生支持);
  • length是 2 的幂保证length - 1的二进制全为 1,这样hash & (length - 1)能充分利用哈希值的低位,分散元素分布,减少冲突。

哈希冲突解决

当两个 Key 计算出相同下标时,HashMap 采用拉链法解决:

  • JDK1.7:新元素以头插法插入链表(扩容时可能导致链表循环,线程不安全);
  • JDK1.8:新元素以尾插法插入链表(解决头插法的循环问题,仍非线程安全);
  • 当链表长度≥8 且数组长度≥64 时,链表转为红黑树,提升查询效率。

五、HashMap 扩容机制

当 HashMap 新增元素后里面的元素个数 > 阈值时,就会触发扩容。

扩容相关的参数:

  • initialCapacity:初始容量;
  • loadFactor:负载因子(扩容阈值比例),默认为0.75;
  • threshold:扩容阈值,值为容量×负载因子。

扩容过程:

  1. 创建新数组,容量 = 旧容量 × 2,阈值 = 旧阈值 × 2;

  2. 遍历原数组中的每一个桶(Bucket),根据桶内结点的状态进行分类处理:

  • 空桶:直接跳过;
  • 单节点(无冲突):重新计算下标newTab[e.hash & (newCap - 1)] = e
  • 链表:判断e.hash & oldCap,为0时元素下标不变,否则下标 = 旧下标 + oldCap;
  • 红黑树:先拆分(逻辑同链表,拆分成两个子树),如果拆分后的子树节点数 ≤ 6,则将该树转回普通链表,否则将重新修剪红黑树放入对应位置。
  1. 将内部成员变量 table 指向这个新数组,新数组替代旧数组,旧数组等待下一次 GC 回收。
相关推荐
jieyucx12 小时前
Go 零基础数据结构:顺序表(像「排抽屉」一样学增删改查)
java·数据结构·golang
曦夜日长12 小时前
C++ STL容器string(一):string的变量细节、默认函数的认识以及常用接口的使用
java·开发语言·c++
代码中介商12 小时前
C++ STL 标准模板库完全指南:从容器到迭代器
开发语言·c++·stl
winner888112 小时前
C++ 构造函数、析构函数、虚函数、虚析构
开发语言·c++
北山有鸟12 小时前
IS_ERR 判断出错后,再用 PTR_ERR 把它强制转换回 int 型的错误码作为函数的返回值。
java·开发语言
格林威12 小时前
工业视觉检测:提供可视化UI调试工具的实现方式是什么?
开发语言·人工智能·数码相机·ui·计算机视觉·视觉检测·工业相机
phltxy12 小时前
深度解析:Spring Cloud Gateway 从入门到实战
java·开发语言
HAPPY酷12 小时前
从Public到Private:UE5 C++类创建路径差异全解析
java·c++·ue5
AI进化营-智能译站12 小时前
ROS2 C++开发系列08-传感器数据缓存与指令解析方式之数组、向量与字符串实战
开发语言·c++·缓存·ai
许彰午12 小时前
CacheSQL(一):手写数据库的工程化重生
java·数据库·缓存