HashMap为什么线程不安全?

一、Put操作(数据覆盖)

HashMap底层是基于数组 + 链表(在 Java 8 以后,当链表长度超过一定阈值时会转换为红黑树)的数据结构。在多线程环境下,当多个线程同时对HashMap进行put操作时,可下面这种情况:

假设两个线程 A 和 B 同时执行put操作,它们计算出的插入位置相同(假设为index)。线程 A 先获取到了当前index位置的节点,在它还没来得及将新节点插入链表(或树)时,线程 B 也获取到了这个位置的节点。然后线程 A 完成插入操作,接着线程 B 也执行插入操作,这就可能导致线程 B 插入的节点覆盖了线程 A 插入的节点,从而丢失数据,如下图。

二、扩容机制产生的问题

HashMap在元素个数达到一定阈值(loadFactor * capacity)时会进行扩容。扩容过程是一个比较复杂的操作,它涉及到重新计算每个元素的hash值和新的存储位置,hashmap扩容采用的是头插法。

2.1 数据访问不一致

在多线程环境下,假设线程 A 正在进行扩容操作,此时线程 B 也在对HashMap进行put操作。由于扩容操作会重新分配数组空间并迁移元素,线程 B 可能会在这个过程中访问到不一致的数据结构。比如,线程 B 可能会读取到还没有完全迁移好的数据,或者在数据迁移过程中出现数据丢失或重复插入等情况。

假设第一次的原表如下:

这时A抢到时间片进入执行,并扩容:

2.2 循环引用问题

在并发环境中,假设有两个线程 A 和 B 同时对 HashMap 进行操作。线程 A 开始进行扩容操作,在遍历旧数组元素的过程中,还没有完成所有元素的重新放置。此时线程 B 也在对这个 HashMap 进行操作,可能会修改元素之间的引用关系。

比如:线程B在遍历过程中完成了整个链表的重新分配,改变了链表的结构。然后线程A继续执行,由于它之前取出了节点1,根据旧的引用关系来插入节点1,但是此时链表结构已经被线程B改变。可能会出现节点1的next指针又重新指向了已经处理过的节点,从而形成一个环形链表。

当后续在对这个 HashMap 进行操作(如get操作),在遍历链表查找元素时,就会陷入这个环形链表的无限循环中,导致程序无法正常运行,这就是多线程扩容导致的死循环问题。

循环引用会导致这些节点无法被垃圾回收。因为垃圾回收器在进行可达性分析时,会发现从根对象出发可以通过引用链一直访问到这些节点,即使它们在逻辑上可能已经不再被程序正常使用,但由于循环引用的存在,它们依然被判定为可达对象,从而无法被回收,产生内存泄漏。

相关推荐
2501_941865633 分钟前
从事件驱动到异步架构的互联网工程语法构建与多语言实践分享
java·开发语言·jvm
前端 贾公子3 小时前
v-if 与 v-for 的优先级对比
开发语言·前端·javascript
嗯嗯=4 小时前
python学习篇
开发语言·python·学习
全靠bug跑6 小时前
Spring Cache 实战:核心注解详解与缓存过期时间配置
java·redis·springcache
不会c嘎嘎7 小时前
QT中的常用控件 (二)
开发语言·qt
聆风吟º7 小时前
【数据结构手札】空间复杂度详解:概念 | 习题
java·数据结构·算法
计算机程序设计小李同学7 小时前
基于SpringBoot的个性化穿搭推荐及交流平台
java·spring boot·后端
是一个Bug7 小时前
50道核心JVM面试题
java·开发语言·面试
朱朱没烦恼yeye7 小时前
java基础学习
java·python·学习
她和夏天一样热7 小时前
【观后感】Java线程池实现原理及其在美团业务中的实践
java·开发语言·jvm