深入理解Java序列化的原理

前言

序列化是将对象转换为可传输格式的过程。是一种数据的持久化手段。一般广泛应用于网络传输,RMI和RPC等场景中。几乎所有的商用编程语言都有序列化的能力,不管是数据存储到硬盘,还是通过网络的微服务传输,都需要序列化能力。

JAVA序列化

在Java的序列化机制中,如果是String,枚举或者实现了Serializable接口的类,均可以通过Java的序列化机制,将类序列化为符合编码的数据流,然后通过InputStream和OutputStream将内存中的类持久化到硬盘或者网络中;同时,也可以通过反序列化机制将磁盘中的字节码再转换成内存中的类。

如果一个类想被序列化,需要实现Serializable接口。否则将抛出NotSerializableException异常。Serializable接口没有方法或字段,仅用于标识可序列化的语义。

自定义类通过实现Serializable接口做标识,进而在I0中实现序列化和反序列化,具体的执行路径如下:

#write0bject ->#write0bject0(判断类是否是自定义类)->#write0rdinaryObject(区分Serializable和Externalizable)->writeSerialData(序列化fields)->invokewriteobject(反射调用类自己的序列化策略)

其中,在invokeWriteObject的阶段,系统就会处理自定义类的序列化方案

这是因为,在序列化操作过程中会对类型进行检查,要求被序列化的类必须属于Enum、Array和Serializable类型其中的任何一种。

Serializable 和 Externalizable 接囗有何不同?

类通过实现 java.io.Serializable 接口以启用其序列化功能。未实现此接口的类将无法使其任何状态序列化或反席列化。可序列化类的所有子类型本身都是可序列化的。序列化接口没有方法或字段,仅用于标识可序列化的语义。

当试图对一个对象进行序列化的时候,如果遇到不支持 Serializable 接口的对象。在此情况下,将抛NotSerializableException,

如果要序列化的类有父类,要想同时将在父类中定义过的变量持久化下来,那么父类也应该实现java.io.Serializable接囗。Externalizable继承了Serializable,该接口中定义了两个抽象方法:writeExternal()与readExternal()。当使用Externalizable接口来进行序列化与反序列化的时候需要开发人员重写writeExternal()与readExternal0方法。如果没有在这两个方法中定义序列化实现细节,那么序列化之后,对象内容为空。实现Externalizable接口的类必须要提供一个public的无参的构造器。

所以,实现Externalizable,并实现writeExternal0)和readExternal()方法可以指定序列化哪些属性。

serialVersionUlD

序列化是将对象的状态信息转换为可存储或传输的形式的过程。我们都知道,Java对象是保存在JVM的堆内存中的,也就是说,如果IM堆不存在了,那么对象也就跟着消失了。

而序列化提供了一种方案,可以让你在即使IM停机的情况下也能把对象保存下来的方案。就像我们平时用的U盘一样。

把Java对象序列化成可存储或传输的形式(如二进制流),比如保存在文件中。这样,当再次需要这个对象的时候,从文件中读取出二进制流,再从二进制流中反序列化出对象。

但是,虚拟机是否允许反序列化,不仅取决于类路径和功能代码是否一致,一个非常重要的一点是两个类的序列化 ID 是否一致,即serialVersionUlD要求一致。在进行反序列化时,JVM会把传来的字节流中的serialVersionUlD与本地相应实体类的serialVersionUID进行比较,如果相同就认为是一致的,可以进行反序列化,否则就会出现序列化版本不一致的异常,即是InvalidCastException。这样做是为了保证安全,因为文件存储中的内容可能被篡改。

当实现java.io.Serializable接口的类没有显式地定义一个serialVersionUID变量时候,Java序列化机制会根据编译的Class自动生成一个serialVersionUlD作序列化版本比较用,这种情况下,如果Class文件没有发生变化,就算再编译多次,seriaVersionUID也不会变化的。但是,如果发生了变化,那么这个文件对应的serialVersionUlD也就会发生变化。

基干以上原理,如果我们一个类实现了Serializable接口,但是没有定义serialVersionUlD,然后序列化。在序列化之后,由于某些原因,我们对该类做了变更,重新启动应用后,我们相对之前序列化过的对象进行反序列化的话就会报错。

在Java中,有哪些好的序列化框架,有什么好处

Java中常用的序列化框架:

java、kryo、hessian、protostuff、gson、fastjson等,

  1. Kryo:速度快,序列化后体积小:跨语言支持较复杂
  2. Hessian:默认支持跨语言:效率不高
  3. Protostuff:速度快,基于protobuf;需静态编译
  4. Protostuff-Runtime:无需静态编译,但序列化前需预先传入schema;不支持无默认构造函数的类,反序列化时需用户自己初始化序列化后的对象,其只负责将该对象进行赋值
  5. Java:使用方便,可序列化所有类:速度慢,占空间
相关推荐
爱学习的白杨树几秒前
MyBatis的一级、二级缓存
java·开发语言·spring
OTWOL6 分钟前
两道数组有关的OJ练习题
c语言·开发语言·数据结构·c++·算法
问道飞鱼9 分钟前
【前端知识】强大的js动画组件anime.js
开发语言·前端·javascript·anime.js
拓端研究室10 分钟前
R基于贝叶斯加法回归树BART、MCMC的DLNM分布滞后非线性模型分析母婴PM2.5暴露与出生体重数据及GAM模型对比、关键窗口识别
android·开发语言·kotlin
Code成立11 分钟前
《Java核心技术I》Swing的网格包布局
java·开发语言·swing
Auc2415 分钟前
使用scrapy框架爬取微博热搜榜
开发语言·python
中草药z16 分钟前
【Spring】深入解析 Spring 原理:Bean 的多方面剖析(源码阅读)
java·数据库·spring boot·spring·bean·源码阅读
QQ同步助手22 分钟前
C++ 指针进阶:动态内存与复杂应用
开发语言·c++
信徒_24 分钟前
常用设计模式
java·单例模式·设计模式
凯子坚持 c28 分钟前
仓颉编程语言深入教程:基础概念和数据类型
开发语言·华为