为什么64位的JVM的对象头中的HashCode长度是31

为什么64位的JVM的对象头中的HashCode长度是31

欢迎来到我的博客:TWind的博客


最近在学juc,看到对象头的解析,突然发现64位下无锁态的HashCode长度为31bits,32位是25bit,当时就在想,为什么是31?String的默认hashCode也是31,两者之间有什么联系吗?可惜的是没能在中文平台发现答案,外文平台经过一番查找终于找到了答案...


先来看64位无锁态对象头的结构:**

其中的hashcode占到了31bits

我们打开idea,使用

java 复制代码
        <dependency>
            <groupId>org.openjdk.jol</groupId>
            <artifactId>jol-core</artifactId>
            <version>0.17</version>
        </dependency>

中的

java 复制代码
ClassLayout.parseInstance(对象).toPrintable()

就能获得一个对象的详细信息:

vbnet 复制代码
OFF  SZ               TYPE DESCRIPTION               VALUE
  0   8                    (object header: mark)     0x0000001626786201 (hash: 0x16267862; age: 0)
  8   4                    (object header: class)    0x00067248
 12   4   java.lang.String Dog.username              (object)
 16   4   java.lang.String Dog.password              (object)
 20   4                    (object alignment gap)    

注意!新创建的对象是默认偏向锁,你获得的结果会是偏向锁的数据!(原因详见jvm的锁机制)

必须要手动掉一次 对象.hashCode(); 方法才会将其转化为无锁态!

把0x0000001626786201转化为二进制:

1011000100110011110000110001000000001

可以看到只有37位,不是说mark_word一共有64位吗,但你从上图可以看到有总共26的空间没用到,所以实际上应该是:

0000000000000000000000000001011000100110011110000110001000000001

其中红色为哈希部分,蓝色为未使用部分,黄色为锁位,这里是001,说明是无锁态

好了,现在来解释,为什么选择31,明明还有这么多空闲位置却不用?

让我们来看markOop.hppjdk7/jdk7/hotspot: 9b0ca45cd756 src/share/vm/oops/markOop.hpp

里面提到了:

c 复制代码
//  - hash contains the identity hash value: largest value is
//    31 bits, see os::random().  Also, 64-bit vm's require
//    a hash value no bigger than 32 bits because they will not
//    properly generate a mask larger than that: see library_call.cpp
//    and c1_CodePatterns_sparc.cpp.

可以知道,

1.os::random()方法只能产生31位的数字,这很好理解,int就是2^31-1

有人会问int不应该是32位吗?但是hashCode没有负数,就去掉int的一个符号位,成了31位(一些情况下会是负数,但这种设定决定了负数决不会是正常情况,大多是计算溢出导致的,或者一些方法抛弃了哈希质量产生了负数)

2.64位的JVM要求hashCode不能超过32位,不然会因为无法产生一个比其更大的掩码而出错

通过这个,我们也能理解为什么java中hashCode返回的是32位的int,原因很简单:更大的数有风险,且需要避免负数

个人觉得还有个原因,2^31 - 1已经很庞大了,所以没必要用到其他空闲部分接着做hashCode

况且对于底层有内存对齐要求 ,系统会把字节 作为一个单位读取(其实也有双字节,四字节读取,计算机是用来读取的),你可以看到:

这里加上分出来的一个未使用的1bit正好是8bit,也就是一字节,能直接读取,效率较高

对于前面的

其实严格来说hashcode是32位的,因为会分一个bit到31bit上组成4字节来直接读取,前面的unused部分也是24位,3字节方便偏移读取

只是这个bit仅仅只是用来对齐的,不属于hashcode,hashcode还是只有31bit


至于32位JVM的对象头 :

25bit是实在没空间的做出的一种妥协,因为25不是8的倍数,效率方面上会有一定的损失

其他地方同64位并没有太多区别

相关推荐
数智顾问5 分钟前
Java坐标转换的多元实现路径:在线调用、百度与高德地图API集成及纯Java代码实现——纯Java代码实现与数学模型深度剖析
java·开发语言
武子康16 分钟前
Java-138 深入浅出 MySQL Spring Boot 事务传播机制全解析:从 REQUIRED 到 NESTED 的实战详解 传播机制原理
java·大数据·数据库·spring boot·sql·mysql·事务
码神本神38 分钟前
【附源码】基于Spring Boot的高校爱心捐助平台的设计与实现
java
真的想不出名儿39 分钟前
登录前验证码校验实现
java·前端·python
珹洺42 分钟前
Java-Spring入门指南(十九)thymeleaf基本概念
java·spring·状态模式
吹晚风吧1 小时前
什么是跨域?跨域怎么解决?跨域解决的是什么问题?
java·vue.js·js·cors
敲码图一乐1 小时前
流量安全——基于Sentinel实现限流,熔断,降级
java·开发语言·数据库
0xMinos1 小时前
Java 设计模式——单例模式
java·设计模式
zzywxc7872 小时前
AI赋能千行百业:金融、医疗、教育、制造业的落地实践与未来展望
java·人工智能·python·microsoft·金融·golang·prompt
一只学java的小汉堡2 小时前
Spring Boot 配置详解:从引导器到注解实战(初学者指南)
java·spring boot·后端