为什么64位的JVM的对象头中的HashCode长度是31

为什么64位的JVM的对象头中的HashCode长度是31

欢迎来到我的博客:TWind的博客


最近在学juc,看到对象头的解析,突然发现64位下无锁态的HashCode长度为31bits,32位是25bit,当时就在想,为什么是31?String的默认hashCode也是31,两者之间有什么联系吗?可惜的是没能在中文平台发现答案,外文平台经过一番查找终于找到了答案...


先来看64位无锁态对象头的结构:**

其中的hashcode占到了31bits

我们打开idea,使用

java 复制代码
        <dependency>
            <groupId>org.openjdk.jol</groupId>
            <artifactId>jol-core</artifactId>
            <version>0.17</version>
        </dependency>

中的

java 复制代码
ClassLayout.parseInstance(对象).toPrintable()

就能获得一个对象的详细信息:

vbnet 复制代码
OFF  SZ               TYPE DESCRIPTION               VALUE
  0   8                    (object header: mark)     0x0000001626786201 (hash: 0x16267862; age: 0)
  8   4                    (object header: class)    0x00067248
 12   4   java.lang.String Dog.username              (object)
 16   4   java.lang.String Dog.password              (object)
 20   4                    (object alignment gap)    

注意!新创建的对象是默认偏向锁,你获得的结果会是偏向锁的数据!(原因详见jvm的锁机制)

必须要手动掉一次 对象.hashCode(); 方法才会将其转化为无锁态!

把0x0000001626786201转化为二进制:

1011000100110011110000110001000000001

可以看到只有37位,不是说mark_word一共有64位吗,但你从上图可以看到有总共26的空间没用到,所以实际上应该是:

0000000000000000000000000001011000100110011110000110001000000001

其中红色为哈希部分,蓝色为未使用部分,黄色为锁位,这里是001,说明是无锁态

好了,现在来解释,为什么选择31,明明还有这么多空闲位置却不用?

让我们来看markOop.hppjdk7/jdk7/hotspot: 9b0ca45cd756 src/share/vm/oops/markOop.hpp

里面提到了:

c 复制代码
//  - hash contains the identity hash value: largest value is
//    31 bits, see os::random().  Also, 64-bit vm's require
//    a hash value no bigger than 32 bits because they will not
//    properly generate a mask larger than that: see library_call.cpp
//    and c1_CodePatterns_sparc.cpp.

可以知道,

1.os::random()方法只能产生31位的数字,这很好理解,int就是2^31-1

有人会问int不应该是32位吗?但是hashCode没有负数,就去掉int的一个符号位,成了31位(一些情况下会是负数,但这种设定决定了负数决不会是正常情况,大多是计算溢出导致的,或者一些方法抛弃了哈希质量产生了负数)

2.64位的JVM要求hashCode不能超过32位,不然会因为无法产生一个比其更大的掩码而出错

通过这个,我们也能理解为什么java中hashCode返回的是32位的int,原因很简单:更大的数有风险,且需要避免负数

个人觉得还有个原因,2^31 - 1已经很庞大了,所以没必要用到其他空闲部分接着做hashCode

况且对于底层有内存对齐要求 ,系统会把字节 作为一个单位读取(其实也有双字节,四字节读取,计算机是用来读取的),你可以看到:

这里加上分出来的一个未使用的1bit正好是8bit,也就是一字节,能直接读取,效率较高

对于前面的

其实严格来说hashcode是32位的,因为会分一个bit到31bit上组成4字节来直接读取,前面的unused部分也是24位,3字节方便偏移读取

只是这个bit仅仅只是用来对齐的,不属于hashcode,hashcode还是只有31bit


至于32位JVM的对象头 :

25bit是实在没空间的做出的一种妥协,因为25不是8的倍数,效率方面上会有一定的损失

其他地方同64位并没有太多区别

相关推荐
妙极矣17 分钟前
JAVAEE初阶01
java·学习·java-ee
碎叶城李白32 分钟前
NIO简单群聊
java·nio
xxjiaz1 小时前
水果成篮--LeetCode
java·算法·leetcode·职场和发展
CodeFox1 小时前
动态线程池 v1.2.1 版本发布,告警规则重构,bytebuddy 替换 cglib,新增 jmh 基准测试等!
java·后端
ℳ₯㎕ddzོꦿ࿐1 小时前
Java集成Zxing和OpenCV实现二维码生成与识别工具类
java·opencv
雪落山庄1 小时前
LeetCode100题
java·开发语言·数据结构
码熔burning2 小时前
【MQ篇】RabbitMQ之发布订阅模式!
java·分布式·rabbitmq·mq
XiaoLeisj2 小时前
【设计模式】深入解析代理模式(委托模式):代理模式思想、静态模式和动态模式定义与区别、静态代理模式代码实现
java·spring boot·后端·spring·设计模式·代理模式·委托模式
李少兄2 小时前
解决Spring Boot版本冲突导致的`NoSuchFieldError`
java·spring boot·后端
pwzs2 小时前
常见的 Spring Boot 注解汇总
java·spring boot·后端·spring