HashMap 扩容为啥总是 2 的倍数?一场来自底层的“强迫症”探险

原文来自于:zha-ge.cn/java/55

HashMap 扩容为啥总是 2 的倍数?一场来自底层的"强迫症"探险

你有没有发现,Java 的 HashMap 用起来挺香,但扩容这事儿真的很神秘。不是 10、不是 16,就是 32、64,总之永远是 2 的倍数,感觉像 HashMap 内部养了个强迫症的架构师。前阵子项目有个同事问我"为啥不搞个19试试",我直接笑出声:你咋不上天呢?

------话说回来,这种底层"奇怪坚持",肯定是有故事的嘛,所以忍不住自己扒拉了一番,收获了一箩筐"啊哈"时刻。来吧,让我用程序员唠嗑语气跟你扯扯这个 2 的倍数扩容背后的小九九!


位运算的浪漫

起初我单纯以为:"HashMap 老老实实用 2 的倍数,不就是方便大家算一算容量么。"但后来翻了一圈源码,发现人家玩的可不是加减法,而是位运算

看下面这点彩蛋------(别担心,代码不长)

java 复制代码
int index = (n - 1) & hash;

瞅见没?这玩意就是用来定位元素放哪的。 如果 n 是 16(2 的 4 次方),n - 1 就是 15,二进制全是 1, 和 hash 做与运算,不就是变相 hash % n 嘛?关键是------ 这玩意比真正的 % 运算快很多倍,省事又高效, 不用 hashCode 取余,不用管 n 是不是质数,直接掐指算!


诡异的坑爹时刻

那天刚搞懂为啥用 2 的倍数,忍不住想皮一下------ "要不试试把容量设成 9,看看会咋样?"

然后我就掉坑了。 早期 JDK 版本里,你自作聪明塞个 9、15 进去,不会善罢甘休: 首先,元素分布就会特别丑------好几个 hashCode 虽然不一样, 结果 &(按位与)出来还是同一个桶, 明明人多桶多,却扎堆到一块儿。 极端点,所有元素全挤一个链表里...... WTF,红黑树都救不了你!

再扒拉一遍扩容源码,好家伙,tableSizeFor(capacity) 直接帮你凑最近的 2 的幂。 你想 9?对不起,给你 16。你想 33?那就 64。老板不让穷,也不让抠!


踩坑瞬间

敲重点!真·苦主现场------

  • 指定了一个"看起来挺合理"的初始容量,结果后台日志一看,嘿,为啥变成 16 了?
  • 算 hash 桶的时候,直接 %,性能不如人家 &,慢慢悠悠卡你没商量。
  • 想用特殊大小调优,发现怎么设都不生效,HashMap 自带"自动纠正机制",就是跟你对着干那种......

经验启示

扒拉了这么一遭,得出的教训如下一箩筐:

  • 不要跟源码较劲,HashMap 就爱 2 的幂,任谁来也改不了。
  • 初始化容量随便给,反正 HashMap 会"圆滑"地给你凑个 2 的倍数。
  • 位运算用得妙,比 % 秒杀好几条街:HashMap 的快感,从底层"算桶"开始。
  • 工作里调优容量时,只要量级对了,不用纠结非要贴着需求给数字------源码帮你"切整"。

------写这篇的时候才体会到,所谓"底层优化",有时真就像设计师的强迫症,但细品还真香!


唠叨到这里,是不是解开你心头"2 的倍数强迫症"的谜团了?下次有人再问,你就劝他放下执念、顺应天命。代码世界嘛,有些"规定动作",还是挺有它的艺术的,你说呢?

好了,我要去泡杯咖啡,发会儿呆,下次见记得点我名!

相关推荐
叫我阿柒啊3 小时前
从Java全栈到前端框架的实战之路
java·数据库·微服务·typescript·前端框架·vue3·springboot
wu~9703 小时前
开发思路篇:转账接口设计
java·开发语言
IT乐手4 小时前
Java 实现异步转同步的方法
java
杨杨杨大侠4 小时前
附录 1:🚀 Maven Central 发布完整指南:从零到成功部署
java·github·maven
渣哥4 小时前
Java HashMap 扩容机制详解:触发条件与实现原理
java
赵星星5204 小时前
Spring Bean线程安全陷阱:90%程序员都会踩的坑,你中招了吗?
java
得物技术4 小时前
0基础带你精通Java对象序列化--以Hessian为例|得物技术
java·后端·编程语言
橘子在努力4 小时前
【橘子SpringCloud】OpenFegin源码分析
java·spring boot·spring·spring cloud
我是廖志伟5 小时前
JVM新生代Eden区域深度解析
java·jvm·memory management