Java序列化机制与原理的深入分析_java

Java序列化算法透析

    Serialization(序列化)是一种将对象以一连串的字节描述的过程;反序列化deserialization是一种将这些字节重建成一个对象的过程。Java序列化API提供一种处理对象序列化的标准机制。在这里你能学到如何序列化一个对象,什么时候需要序列化以及Java序列化的算法,我们用一个实例来示范序列化以后的字节是如何描述一个对象的信息的。
序列化的必要性

    Java中,一切都是对象,在分布式环境中经常需要将Object从这一端网络或设备传递到另一端。这就需要有一种可以在两端传输数据的协议。Java序列化机制就是为了解决这个问题而产生。
如何序列化一个对象

一个对象能够序列化的前提是实现Serializable接口,Serializable接口没有方法,更像是个标记。有了这个标记的Class就能被序列化机制处理。

复制代码 代码如下:

import java.io.Serializable;      
class TestSerial implements Serializable {      
           public byte version = 100;    
           public byte count = 0;      
}

    然后我们写个程序将对象序列化并输出。ObjectOutputStream能把Object输出成Byte流。我们将Byte流暂时存储到temp.out文件里。

复制代码 代码如下:

public static void main(String args[]) throws IOException {      
    FileOutputStream fos = new FileOutputStream("temp.out");      
    ObjectOutputStream oos = new ObjectOutputStream(fos);      
    TestSerial ts = new TestSerial();      
    oos.writeObject(ts);      
    oos.flush();      
    oos.close();      
}

    如果要从持久的文件中读取Bytes重建对象,我们可以使用ObjectInputStream。

复制代码 代码如下:

public static void main(String args[]) throws      IOException {      
      FileInputStream fis = new FileInputStream("temp.out");      
      ObjectInputStream oin = new ObjectInputStream(fis);      
      TestSerial ts = (TestSerial) oin.readObject();      
       System.out.println("version="+ts.version);      
 }

执行结果为

100.
对象的序列化格式

将一个对象序列化后是什么样子呢?打开刚才我们将对象序列化输出的temp.out文件,以16进制方式显示。内容应该如下:

复制代码 代码如下:

AC ED 00 05 73 72 00 0A 53 65 72 69 61 6C 54 65

73 74 A0 0C 34 00 FE B1 DD F9 02 00 02 42 00 05

63 6F 75 6E 74 42 00 07 76 65 72 73 69 6F 6E 78

70 00 64

这一坨字节就是用来描述序列化以后的TestSerial对象的,我们注意到TestSerial类中只有两个域:

    public byte version = 100;

    public byte count = 0;

且都是byte型,理论上存储这两个域只需要2个byte,但是实际上temp.out占据空间为51bytes,也就是说除了数据以外,还包括了对序列化对象的其他描述。
Java的序列化算法

序列化算法一般会按步骤做如下事情:

◆将对象实例相关的类元数据输出。

◆递归地输出类的超类描述直到不再有超类。

◆类元数据完了以后,开始从最顶层的超类开始输出对象实例的实际数据值。

◆从上至下递归输出实例的数据

我们用另一个更完整覆盖所有可能出现的情况的例子来说明:

复制代码 代码如下:

    class parent implements Serializable {      
           int parentVersion = 10;      
    } 

    class contain implements Serializable{      
           int containVersion = 11;      
    } 

    public class SerialTest extends parent implements Serializable {      
           int version = 66;      
           contain con = new contain();                  
           public int getVersion() {      
                  return version;      
           }      
           public static void main(String args[]) throws IOException {      
                  FileOutputStream fos = new FileOutputStream("temp.out");      
                  ObjectOutputStream oos = new ObjectOutputStream(fos);      
                  SerialTest st = new SerialTest();      
                  oos.writeObject(st);      
                  oos.flush();      
                  oos.close();      
           }      
    }

这个例子是相当的直白啦。SerialTest类实现了Parent超类,内部还持有一个Container对象。

序列化后的格式如下:

AC ED 00 05 73 72 00 0A 53 65 72 69 61 6C 54 65

73 74 05 52 81 5A AC 66 02 F6 02 00 02 49 00 07

76 65 72 73 69 6F 6E 4C 00 03 63 6F 6E 74 00 09

4C 63 6F 6E 74 61 69 6E 3B 78 72 00 06 70 61 72

65 6E 74 0E DB D2 BD 85 EE 63 7A 02 00 01 49 00

0D 70 61 72 65 6E 74 56 65 72 73 69 6F 6E 78 70

00 00 00 0A 00 00 00 42 73 72 00 07 63 6F 6E 74

61 69 6E FC BB E6 0E FB CB 60 C7 02 00 01 49 00

0E 63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E 78

70 00 00 00 0B

我们来仔细看看这些字节都代表了啥。开头部分,见颜色:

  1. AC ED: STREAM_MAGIC. 声明使用了序列化协议.
  2. 00 05: STREAM_VERSION. 序列化协议版本.
  3. 0x73: TC_OBJECT. 声明这是一个新的对象.  

序列化算法的第一步就是输出对象相关类的描述。例子所示对象为SerialTest类实例,因此接下来输出SerialTest类的描述。见颜色:

  1. 0x72: TC_CLASSDESC. 声明这里开始一个新Class。
  2. 00 0A: Class名字的长度.
  3. 53 65 72 69 61 6c 54 65 73 74: SerialTest,Class类名.
  4. 05 52 81 5A AC 66 02 F6: SerialVersionUID, 序列化ID,如果没有指定,则会由算法随机生成一个8byte的ID.
  5. 0x02: 标记号. 该值声明该对象支持序列化。
  6. 00 02: 该类所包含的域个数。

接下来,算法输出其中的一个域,int version=66;见颜色:

  1. 0x49: 域类型. 49 代表"I", 也就是Int.
  2. 00 07: 域名字的长度.
  3. 76 65 72 73 69 6F 6E: version,域名字描述.

然后,算法输出下一个域,contain con = new contain();这个有点特殊,是个对象。描述对象类型引用时需要使用JVM的标准对象签名表示法,见颜色:

  1. 0x4C: 域的类型.
  2. 00 03: 域名字长度.
  3. 63 6F 6E: 域名字描述,con
  4. 0x74: TC_STRING. 代表一个new String.用String来引用对象。
  5. 00 09: 该String长度.
  6. 4C 63 6F 6E 74 61 69 6E 3B: Lcontain;, JVM的标准对象签名表示法.
  7. 0x78: TC_ENDBLOCKDATA,对象数据块结束的标志

.接下来算法就会输出超类也就是Parent类描述了,见颜色:

  1. 0x72: TC_CLASSDESC. 声明这个是个新类.
  2. 00 06: 类名长度.
  3. 70 61 72 65 6E 74: parent,类名描述。
  4. 0E DB D2 BD 85 EE 63 7A: SerialVersionUID, 序列化ID.
  5. 0x02: 标记号. 该值声明该对象支持序列化.
  6. 00 01: 类中域的个数.

下一步,输出parent类的域描述,int parentVersion=100;同见颜色:

  1. 0x49: 域类型. 49 代表"I", 也就是Int.
  2. 00 0D: 域名字长度.
  3. 70 61 72 65 6E 74 56 65 72 73 69 6F 6E: parentVersion,域名字描述。
  4. 0x78: TC_ENDBLOCKDATA,对象块结束的标志。
  5. 0x70: TC_NULL, 说明没有其他超类的标志。.

到此为止,算法已经对所有的类的描述都做了输出。下一步就是把实例对象的实际值输出了。这时候是从parent Class的域开始的,见颜色:

  1. 00 00 00 0A: 10, parentVersion域的值.

还有SerialTest类的域:

  1. 00 00 00 42: 66, version域的值.

再往后的bytes比较有意思,算法需要描述contain类的信息,要记住,现在还没有对contain类进行过描述,见颜色:

  1. 0x73: TC_OBJECT, 声明这是一个新的对象.
  2. 0x72: TC_CLASSDESC声明这里开始一个新Class.
  3. 00 07: 类名的长度.
  4. 63 6F 6E 74 61 69 6E: contain,类名描述.
  5. FC BB E6 0E FB CB 60 C7: SerialVersionUID, 序列化ID.
  6. 0x02: Various flags. 标记号. 该值声明该对象支持序列化
  7. 00 01: 类内的域个数。

.输出contain的唯一的域描述,int containVersion=11;

  1. 0x49: 域类型. 49 代表"I", 也就是Int..
  2. 00 0E: 域名字长度.
  3. 63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E: containVersion, 域名字描述.
  4. 0x78: TC_ENDBLOCKDATA对象块结束的标志.

这时,序列化算法会检查contain是否有超类,如果有的话会接着输出。

  1. 0x70:TC_NULL,没有超类了。

最后,将contain类实际域值输出。

  1. 00 00 00 0B: 11, containVersion的值.

OK,我们讨论了java序列化的机制和原理,希望能对同学们有所帮助。

时间: 2024-08-02 08:54:01

Java序列化机制与原理的深入分析_java的相关文章

java序列化与反序列化操作实例分析_java

本文实例分析了java序列化与反序列化操作.分享给大家供大家参考,具体如下: 概述: Java序列化是指把Java对象转换为字节序列的过程;而Java反序列化是指把字节序列恢复为Java对象的过程. 示例代码: import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.i

Java多线程之异步Future机制的原理和实现_java

项目中经常有些任务需要异步(提交到线程池中)去执行,而主线程往往需要知道异步执行产生的结果,这时我们要怎么做呢?用runnable是无法实现的,我们需要用callable看下面的代码: import java.util.concurrent.Callable; import java.util.concurrent.ExecutionException; import java.util.concurrent.ExecutorService; import java.util.concurren

Java反射机制(Reflection)浅析_java

Reflection也就是反射,是Java语言的一个重要特征,我们知道,在使用一个类之前,我们往往都已经创建好它了,比如创建一个类文件,然后再写些属性.方法等,也就是这种类是静态的,但反射机制却允许你动态地创建一个类.除了动态地创建一个类外,我们还能动态地获取同类对象的数据,并将这些数据赋给新创建的类,这有点类似克隆复制.在很多时候,我们都需要这种动态创建类的特征,比如在处理一些业务,但这些业务却又稍有区别的时候,往往对应着多个类,在处理的时候,我们就要根据不同的业务处理来调用不同的类,这个时候

java HashMap 的工作原理详解_java

HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hashtable和HashMap之间的区别,那么为何这道面试题如此特殊呢?是因为这道题考察的深度很深.这题经常出现在高级或中高级面试中.投资银行更喜欢问这个问题,甚至会要求你实现HashMap来考察你的编程能力.ConcurrentHashMap和其它同步集合的引入让这道题变得更加复杂.让我们开始探索的旅程吧! 先来些简单的问题 "你用过HashMap吗?&quo

Java可见性机制的原理

基本概念 1.可见性 当一个线程修改了共享变量时,另一个线程可以读取到这个修改后的值. 2.内存屏障(Memory Barriers) 处理器的一组指令,用于实现对内存操作的顺序限制. 3.缓冲行 CPU告诉缓存中可以分配的最小存储单位,处理器填写缓存行时,会加载整个缓存行. 4.Lock前缀的指令 Lock前缀的指令在多核处理器下会发生两件事情: 1)将当前处理器的缓存行的数据协会到系统内存. 2)这个写回内存的操作会使其他CPU缓存了该内存的地址的数据无效. 5.缓存一致性协议 在多处理器下

java字符串与格式化输出的深入分析_java

1.String类.StringBuilder类.StringBuffer类String对象是不可变的,重载了运算符+,于是String s="a"+2+"b"+2.2;这条语句就创建了4个String对象对象,把最后创建的对象引用赋给s. 但是String类定义了许多常用的对字符串进行操作的方法:取字符串长度length.判断是否为空串isEmpty.返回字符数组或字节数组toCharArray().取得指定索引的字符charAt().字符串比较equals()c

Java反射机制的实现详解_java

很多主流框架都使用了反射技术.像ssh框架都采用两种技术 xml做配置文件+反射技术. 与反射有关的类包. java.lang.reflect.*;和java.lang.Class; Java中所有类型(包括基本类型)都对应一个Class对象,这个Class就是java.lang.Class.即每一个类型,在Class中都有一个Class对象跟它对应.Class 没有公共构造方法.注意不是没有,是没有公共的. 如何获得Class对象 复制代码 代码如下: .针对每一个对象.getCalss(),

Java序列化的机制和原理

有关Java对象的序列化和反序列化也算是Java基础的一部分,下面对Java序列化的机制和原理进行一些介绍. Java 序列化算法透析 Serialization(序列化)是一种将对象以一连串的字节描述的过程:反序列化deserialization是一种将这些字节重建成一个对象的过程.Java序列化API提供一种处理对象序列化的标准机制.在这里你能学到如何序列化一个对象,什么时候需要序列化以及Java序列化的算法,我们用一个实例来示范序列化以后的字节是如何描述一个对象的信息的. 序列化的必要性

Java序列化(Serialization) 机制_java

  Java中,一切都是对象,在分布式环境中经常需要将Object从这一端网络或设备传递到另一端.这就需要有一种可以在两端传输数据的协议.Java序列化机制就是为了解决这个问题而产生. 将对象状态转换成字节流之后,可以用java.io包中各种字节流的类将其保存到文件中,管道到另一线程中或通过网络连接将对象数据发送到另一主机.对象序列化功能非常简单.强大,在RMI.Socket.JMS.EJB都有应用.对象序列化问题在网络编程中并不是最核心的课题,但却相当重要,具有许多实用意义. java对象序列