上一小节我们学习了 Java 的输入输出流,有了这些前置知识点,我们就可以学习 Java 的序列化了。本小节将介绍什么是序列化、什么是反序列化、序列化有什么作用,如何实现序列化与反序列化,Serializable 接口介绍,常用序列化工具介绍等内容。了解序列化的用途、学会如何进行序列化和反序列化操作是本小节的重点内容。

1. 序列化与反序列化

序列化在计算机科学的数据处理中,是指将数据结构或对象状态转换成可取用格式,以留待后续在相同或另一台计算机环境中,能恢复原先状态的过程。依照序列化格式重新获取字节的结果时,可以利用它来产生与原始对象相同语义的副本。

很多编程语言自身就支持序列化操作。Java 语言提供自动序列化,序列化(serialize)就是将对象转换为字节流;与之相应对的,反序列化(deserialize)就是将字节流转换为对象。
需要注意的是,Java 序列化对象时,会把对象的状态保存成字节序列,对象的状态指的就是其成员变量,因此序列化的对象不会保存类的静态变量。
在 Java 中,可通过对象输出/输入流来实现序列化/反序列化操作。 java.io包中,提供了ObjectInputStream类和ObjectOutputStream用来序列化对象,这两个类我们将在下面介绍。下面我们来介绍一下序列化的作用。

2. 序列化的作用

  • 序列化可以将对象的字节序列存持久化:可以将其保存在内存、文件、数据库中(见下图);
  • 可以在网络上传输对象字节序列
  • 可用于远端程序方法调用

3.jpg

3. 实现序列化

  • ObjectOutputStream类下的void writeObject(Object obj)方法用于将一个对象写入对象输出流,也就是序列化;
  • ObjectInputStream类下的Object readObject()方法用于读取一个对象到输入流,也就是反序列化。

实例代码如下:

  1. import java.io.*;
  2. public class SerializeDemo1 {
  3. static class Cat implements Serializable {
  4. private static final long serialVersionUID = 1L;
  5. private String nickname;
  6. private Integer age;
  7. public Cat() {}
  8. public Cat(String nickname, Integer age) {
  9. this.nickname = nickname;
  10. this.age = age;
  11. }
  12. @Override
  13. public String toString() {
  14. return "Cat{" +
  15. "nickname='" + nickname + '\'' +
  16. ", age=" + age +
  17. '}';
  18. }
  19. }
  20. /**
  21. * 序列化方法
  22. * @param filepath 文件路径
  23. * @param cat 要序列化的对象
  24. * @throws IOException
  25. */
  26. private static void serialize(String filepath, Cat cat) throws IOException {
  27. // 实例化file对象
  28. File file = new File(filepath);
  29. // 实例化文件输出流
  30. FileOutputStream fileOutputStream = new FileOutputStream(file);
  31. // 实例化对象输出流
  32. ObjectOutputStream objectOutputStream = new ObjectOutputStream(fileOutputStream);
  33. // 保存cat对象
  34. objectOutputStream.writeObject(cat);
  35. // 关闭流
  36. fileOutputStream.close();
  37. objectOutputStream.close();
  38. }
  39. /**
  40. * 反序列化方法
  41. * @param filepath 文件路径
  42. * @throws IOException
  43. * @throws ClassNotFoundException
  44. */
  45. private static void deserialize(String filepath) throws IOException, ClassNotFoundException {
  46. // 实例化file对象
  47. File file = new File(filepath);
  48. // 实例化文件输入流
  49. FileInputStream fileInputStream = new FileInputStream(file);
  50. // 实例化对象输入流
  51. ObjectInputStream objectInputStream = new ObjectInputStream(fileInputStream);
  52. Object o = objectInputStream.readObject();
  53. System.out.println(o);
  54. }
  55. public static void main(String[] args) throws IOException, ClassNotFoundException {
  56. String filename = "D:\\新建文件夹\\JavaProject\\HelloJava\\code\\Hello.txt";
  57. Cat cat = new Cat("猪皮", 1);
  58. serialize(filename, cat);
  59. deserialize(filename);
  60. }
  61. }

运行结果:

  1. Cat{nickname='猪皮', age=1}

上述代码中,我们定义了一个Cat类,它实现了Serializable接口,类内部有一个private static final long serialVersionUID = 1L;,关于这两点,我们下面紧接着就会介绍。
除了Cat类的定义,我们还分别封装了序列化与反序列化的方法,并在主方法中调用了这两个方法,实现了cat对象的序列化和反序列化操作。
在调用序列化方法后,你会发现磁盘中的Hello.txt文件中被cat对象写入了序列化后的数据:
image.png

4. Seralizable 接口

被序列化的类必须是Enum、Array或Serializable中的任意一种类型。
如果要序列化的类不是枚举类型和数组类型的话,则必须实现java.io.Seralizable接口,否则直接序列化将抛出NotSerializableException异常。

4.1 serialVersionUID

serialVersionUID 是 Java 为每个序列化类产生的版本标识。它可以用来保证在反序列化时,发送方发送的和接受方接收的是可兼容的对象。如果接收方接收的类的 serialVersionUID 与发送方发送的 serialVersionUID 不一致,会抛出 InvalidClassException。

4.2 默认序列化机制

如果仅仅只是让某个类实现 Serializable 接口,而没有其它任何处理的话,那么就会使用默认序列化机制。
使用默认机制,在序列化对象时,不仅会序列化当前对象本身,还会对其父类的字段以及该对象引用的其它对象也进行序列化。同样地,这些其它对象引用的另外对象也将被序列化,以此类推。所以,如果一个对象包含的成员变量是容器类对象,而这些容器所含有的元素也是容器类对象,那么这个序列化的过程就会较复杂,开销也较大。

4.3 transient 关键字

在现实应用中,有些时候不能使用默认序列化机制。比如,希望在序列化过程中忽略掉敏感数据,或者简化序列化过程。下面将介绍若干影响序列化的方法。
当某个字段被声明为 transient 后,默认序列化机制就会忽略该字段
可以尝试将实例代码中Cat类的成员变量age声明为transient:

  1. // 仅部分代码
  2. static class Cat implements Serializable {
  3. transient private Integer age;
  4. }

运行程序,我们会发现成员变量age没有被序列化。

5. 常用序列化工具

Java 官方的序列化存在很多缺点,因此,开发者们更倾向于使用优秀的第三方序列化工具来替代 Java 自身的序列化机制。
Java 官方的序列化主要体现在以下方面:

  • 性能问题:序列化后的数据相对于一些优秀的序列化的工具,还是要大不少,这大大影响存储和传输的效率;
  • 繁琐的步骤:Java 官方的序列化一定需要实现 Serializable 接口,略显繁琐,而且需要关注 serialVersionUID;
  • 无法跨语言使用:序列化的很大一个目的就是用于不同语言来读写数据。

下面列举了一些优秀的序列化工具:

  • thriftprotobuf - 适用于对性能敏感,对开发体验要求不高的内部系统。
  • hessian - 适用于对开发体验敏感,性能有要求的内外部系统。
  • jacksongsonfastjson - 适用于对序列化后的数据要求有良好的可读性(转为 json 、xml 形式)。

    6. 小结

    通过本小节的学习,我们知道了序列化(serialize)就是将对象转换为字节流,反序列化(deserialize)就是将字节流转换为对象。想要实现序列化,就必须继承Seralizable接口,serialVersionUID 是 Java 为每个序列化类产生的版本标识。当某个字段被声明为 transient 后,默认序列化机制就会忽略该字段。学会根据自己的应用场景选择使用序列化工具。