java打卡学习4:HashMap底层结构、扩容机制

HashMap底层结构

HashMap的底层结构在JDK1.8之前是数组+链表 ,JDK1.8及之后改为数组+链表+红黑树

  • 数组 :称为哈希桶(Node<K,V>[] table),用于存储键值对的节点。数组的每个位置称为一个桶(bucket),通过哈希函数计算键的哈希值确定存储位置。
  • 链表:当哈希冲突(不同键的哈希值映射到同一数组下标)时,采用链表解决冲突,新节点以头插法(JDK1.7)或尾插法(JDK1.8)加入链表。
  • 红黑树:当链表长度超过阈值(默认为8)且数组长度≥64时,链表转换为红黑树,以提高查询效率(时间复杂度从O(n)降至O(log n))。

HashMap扩容机制

HashMap的扩容通过resize()方法实现,核心逻辑如下:

  • 触发条件

    1. 当前元素数量超过阈值(threshold = capacity * loadFactor,默认负载因子loadFactor=0.75)。
    2. 链表长度≥8但数组长度<64时,优先扩容而非树化。
  • 扩容过程

    1. 创建新数组,容量为原数组的2倍(newCap = oldCap << 1)。
    2. 重新计算节点位置:
      • 若节点无冲突(无链表/红黑树),直接按(newCap - 1) & hash确定新位置。
      • 若节点是树节点,拆分红黑树为两条链表(根据高位哈希值),若链表长度≤6则退化为链表。
      • 若节点是链表节点,拆分为两条链表(高位链表和低位链表),分别放入新数组的原位置原位置 + oldCap
  • 性能优化

    JDK1.8通过高位与低位链表拆分,避免重新计算哈希值,提升扩容效率。

关键参数

  • 初始容量:默认16,建议设为2的幂次方(便于哈希计算)。
  • 负载因子:默认0.75,权衡空间利用率与哈希冲突概率。

示例代码(哈希计算与扩容片段)

java 复制代码
// JDK1.8中的哈希计算(扰动函数)
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

// 扩容时的节点位置计算
if ((e.hash & oldCap) == 0) {
    // 放入低位链表(原位置)
} else {
    // 放入高位链表(原位置 + oldCap)
}

代码模拟

以下是一个简化版的HashMap扩容模拟代码:

java 复制代码
public class SimulatedHashMap<K, V> {
    private static final int DEFAULT_CAPACITY = 16;
    private static final float DEFAULT_LOAD_FACTOR = 0.75f;
    private Entry<K, V>[] table;
    private int size;
    private int threshold;

    public SimulatedHashMap() {
        table = new Entry[DEFAULT_CAPACITY];
        threshold = (int) (DEFAULT_CAPACITY * DEFAULT_LOAD_FACTOR);
    }

    public void put(K key, V value) {
        if (size >= threshold) {
            resize();
        }
        int hash = key.hashCode();
        int index = hash % table.length;
        Entry<K, V> entry = new Entry<>(key, value, hash);
        if (table[index] == null) {
            table[index] = entry;
        } else {
            Entry<K, V> current = table[index];
            while (current.next != null) {
                current = current.next;
            }
            current.next = entry;
        }
        size++;
    }

    private void resize() {
        int newCapacity = table.length * 2;
        Entry<K, V>[] newTable = new Entry[newCapacity];
        for (Entry<K, V> entry : table) {
            while (entry != null) {
                int newIndex = entry.hash % newCapacity;
                Entry<K, V> next = entry.next;
                entry.next = newTable[newIndex];
                newTable[newIndex] = entry;
                entry = next;
            }
        }
        table = newTable;
        threshold = (int) (newCapacity * DEFAULT_LOAD_FACTOR);
    }

    static class Entry<K, V> {
        K key;
        V value;
        int hash;
        Entry<K, V> next;

        Entry(K key, V value, int hash) {
            this.key = key;
            this.value = value;
            this.hash = hash;
        }
    }
}

关键点说明

  • 负载因子:默认0.75,权衡空间和时间效率。较高的负载因子减少内存占用但增加冲突概率。
  • rehash:扩容时重新计算每个元素的哈希值和新位置,可能改变原有链表的顺序。
  • 链表处理:Java 8后在链表长度超过8时会转换为红黑树,优化查找性能。

性能影响

扩容是一个昂贵的操作,时间复杂度为O(n)。为避免频繁扩容,初始化时可以预估容量大小,例如:

java 复制代码
Map<String, String> map = new HashMap<>(expectedSize);

HashMap底层结构是数组+链表/红黑树(JDK8及以后),扩容机制是当元素数量超过(容量×负载因子)时触发扩容,扩容时创建双倍容量新数组,并通过高位运算重新计算节点位置。

相关推荐
qq_297574672 小时前
K8s系列第十四篇:K8s 故障排查实战:常见故障定位与解决方法
java·docker·kubernetes
Flittly2 小时前
【SpringAIAlibaba新手村系列】(3)ChatModel 与 ChatClient 的深度对比
java·人工智能·spring boot·spring
2401_835792542 小时前
Java复习上
java·开发语言·python
小昭在路上……2 小时前
编译与链接的本质:段(Section)的生成与定位
java·linux·开发语言
qq_389600132 小时前
pads 学习笔记
笔记·学习
启山智软2 小时前
【智能商城系统技术架构优势】
java·spring·开源·商城开发
迷藏4942 小时前
# 发散创新:基于Solidity的NFT智能合约设计与部署实战在区块链技术飞速发展
java·区块链·智能合约
tq10862 小时前
从对象互操作性角度分析 `from` 与 `to` 方法的选择
java
IT 行者2 小时前
实战LangChain4j集成MCP Server:让Java AI应用具备工具调用能力
java·开发语言·人工智能