Java 1.1增添了一种有趣的特性,名为“对象序列化”(Object Serialization)。它面向那些实现了Serializable接口的对象,可将它们转换成一系列字节,并可在以后完全恢复回原来的样子。这一过程亦可通过网络进行。这意味着序列化机制能自动补偿操作系统间的差异。换句话说,可以先在Windows机器上创建一个对象,对其序列化,然后通过网络发给一台Unix机器,然后在那里准确无误地重新“装配”。不必关心数据在不同机器上如何表示,也不必关心字节的顺序或者其他任何细节。

就其本身来说,对象的序列化是非常有趣的,因为利用它可以实现“有限持久化”。请记住“持久化”意味着对象的“生存时间”并不取决于程序是否正在执行——它存在或“生存”于程序的每一次调用之间。通过序列化一个对象,将其写入磁盘,以后在程序重新调用时重新恢复那个对象,就能圆满实现一种“持久”效果。之所以称其为“有限”,是因为不能用某种persistent(持久)关键字简单地地定义一个对象,并让系统自动照看其他所有细节问题(尽管将来可能成为现实)。相反,必须在自己的程序中明确地序列化和组装对象。

语言里增加了对象序列化的概念后,可提供对两种主要特性的支持。Java 1.1的“远程方法调用”(RMI)使本来存在于其他机器的对象可以表现出好象就在本地机器上的行为。将消息发给远程对象时,需要通过对象序列化来传输参数和返回值。RMI将在第15章作具体讨论。

对象的序列化也是Java Beans必需的,后者由Java 1.1引入。使用一个Bean时,它的状态信息通常在设计期间配置好。程序启动以后,这种状态信息必须保存下来,以便程序启动以后恢复;具体工作由对象序列化完成。

对象的序列化处理非常简单,只需对象实现了Serializable接口即可(该接口仅是一个标记,没有方法)。在Java 1.1中,许多标准库类都发生了改变,以便能够序列化——其中包括用于基本数据类型的全部包装器、所有集合类以及其他许多东西。甚至Class对象也可以序列化(第11章讲述了具体实现过程)。

为序列化一个对象,首先要创建某些OutputStream对象,然后将其封装到ObjectOutputStream对象内。此时,只需调用writeObject()即可完成对象的序列化,并将其发送给OutputStream。相反的过程是将一个InputStream封装到ObjectInputStream内,然后调用readObject()。和往常一样,我们最后获得的是指向一个向上转换Object的引用,所以必须向下转换,以便能够直接设置。

对象序列化特别“聪明”的一个地方是它不仅保存了对象的“全景图”,而且能追踪对象内包含的所有引用并保存那些对象;接着又能对每个对象内包含的引用进行追踪;以此类推。我们有时将这种情况称为“对象网”,单个对象可与之建立连接。而且它还包含了对象的引用数组以及成员对象。若必须自行操纵一套对象序列化机制,那么在代码里追踪所有这些链接时可能会显得非常麻烦。在另一方面,由于Java对象的序列化似乎找不出什么缺点,所以请尽量不要自己动手,让它用优化的算法自动维护整个对象网。下面这个例子对序列化机制进行了测试。它建立了许多链接对象的一个Worm(蠕虫),每个对象都与Worm中的下一段链接,同时又与属于不同类(Data)的对象引用数组链接:

  1. //: Worm.java
  2. // Demonstrates object serialization in Java 1.1
  3. import java.io.*;
  4. class Data implements Serializable {
  5. private int i;
  6. Data(int x) { i = x; }
  7. public String toString() {
  8. return Integer.toString(i);
  9. }
  10. }
  11. public class Worm implements Serializable {
  12. // Generate a random int value:
  13. private static int r() {
  14. return (int)(Math.random() * 10);
  15. }
  16. private Data[] d = {
  17. new Data(r()), new Data(r()), new Data(r())
  18. };
  19. private Worm next;
  20. private char c;
  21. // Value of i == number of segments
  22. Worm(int i, char x) {
  23. System.out.println(" Worm constructor: " + i);
  24. c = x;
  25. if(--i > 0)
  26. next = new Worm(i, (char)(x + 1));
  27. }
  28. Worm() {
  29. System.out.println("Default constructor");
  30. }
  31. public String toString() {
  32. String s = ":" + c + "(";
  33. for(int i = 0; i < d.length; i++)
  34. s += d[i].toString();
  35. s += ")";
  36. if(next != null)
  37. s += next.toString();
  38. return s;
  39. }
  40. public static void main(String[] args) {
  41. Worm w = new Worm(6, 'a');
  42. System.out.println("w = " + w);
  43. try {
  44. ObjectOutputStream out =
  45. new ObjectOutputStream(
  46. new FileOutputStream("worm.out"));
  47. out.writeObject("Worm storage");
  48. out.writeObject(w);
  49. out.close(); // Also flushes output
  50. ObjectInputStream in =
  51. new ObjectInputStream(
  52. new FileInputStream("worm.out"));
  53. String s = (String)in.readObject();
  54. Worm w2 = (Worm)in.readObject();
  55. System.out.println(s + ", w2 = " + w2);
  56. } catch(Exception e) {
  57. e.printStackTrace();
  58. }
  59. try {
  60. ByteArrayOutputStream bout =
  61. new ByteArrayOutputStream();
  62. ObjectOutputStream out =
  63. new ObjectOutputStream(bout);
  64. out.writeObject("Worm storage");
  65. out.writeObject(w);
  66. out.flush();
  67. ObjectInputStream in =
  68. new ObjectInputStream(
  69. new ByteArrayInputStream(
  70. bout.toByteArray()));
  71. String s = (String)in.readObject();
  72. Worm w3 = (Worm)in.readObject();
  73. System.out.println(s + ", w3 = " + w3);
  74. } catch(Exception e) {
  75. e.printStackTrace();
  76. }
  77. }
  78. } ///:~

更有趣的是,Worm内的Data对象数组是用随机数字初始化的(这样便不用怀疑编译器保留了某种原始信息)。每个Worm段都用一个Char标记。这个Char是在重复生成链接的Worm列表时自动产生的。创建一个Worm时,需告诉构造器希望它有多长。为产生下一个引用(next),它总是用减去1的长度来调用Worm构造器。最后一个next引用则保持为null(空),表示已抵达Worm的尾部。

上面的所有操作都是为了加深事情的复杂程度,加大对象序列化的难度。然而,真正的序列化过程却是非常简单的。一旦从另外某个流里创建了ObjectOutputStreamwriteObject()就会序列化对象。注意也可以为一个String调用writeObject()。亦可使用与DataOutputStream相同的方法写入所有基本数据类型(它们有相同的接口)。

有两个单独的try块看起来是类似的。第一个读写的是文件,而另一个读写的是一个ByteArray(字节数组)。可利用对任何DataInputStream或者DataOutputStream的序列化来读写特定的对象;正如在关于连网的那一章会讲到的那样,这些对象甚至包括网络。一次循环后的输出结果如下:

  1. Worm constructor: 6
  2. Worm constructor: 5
  3. Worm constructor: 4
  4. Worm constructor: 3
  5. Worm constructor: 2
  6. Worm constructor: 1
  7. w = :a(262):b(100):c(396):d(480):e(316):f(398)
  8. Worm storage, w2 = :a(262):b(100):c(396):d(480):e(316):f(398)
  9. Worm storage, w3 = :a(262):b(100):c(396):d(480):e(316):f(398)

可以看出,装配回原状的对象确实包含了原来那个对象里包含的所有链接。

注意在对一个Serializable(可序列化)对象进行重新装配的过程中,不会调用任何构造器(甚至默认构造器)。整个对象都是通过从InputStream中取得数据恢复的。

作为Java 1.1特性的一种,我们注意到对象的序列化并不属于新的ReaderWriter层次结构的一部分,而是沿用老式的InputStreamOutputStream结构。所以在一些特殊的场合下,不得不混合使用两种类型的层次结构。

10.9.1 寻找类

读者或许会奇怪为什么需要一个对象从它的序列化状态中恢复。举个例子来说,假定我们序列化一个对象,并通过网络将其作为文件传送给另一台机器。此时,位于另一台机器的程序可以只用文件目录来重新构造这个对象吗?

回答这个问题的最好方法就是做一个实验。下面这个文件位于本章的子目录下:

  1. //: Alien.java
  2. // A serializable class
  3. import java.io.*;
  4. public class Alien implements Serializable {
  5. } ///:~

用于创建和序列化一个Alien对象的文件位于相同的目录下:

  1. //: FreezeAlien.java
  2. // Create a serialized output file
  3. import java.io.*;
  4. public class FreezeAlien {
  5. public static void main(String[] args)
  6. throws Exception {
  7. ObjectOutput out =
  8. new ObjectOutputStream(
  9. new FileOutputStream("file.x"));
  10. Alien zorcon = new Alien();
  11. out.writeObject(zorcon);
  12. }
  13. } ///:~

该程序并不是捕获和控制异常,而是将异常简单、直接地传递到main()外部,这样便能在命令行报告它们。

程序编译并运行后,将结果产生的file.x复制到名为xfiles的子目录,代码如下:

  1. //: ThawAlien.java
  2. // Try to recover a serialized file without the
  3. // class of object that's stored in that file.
  4. package c10.xfiles;
  5. import java.io.*;
  6. public class ThawAlien {
  7. public static void main(String[] args)
  8. throws Exception {
  9. ObjectInputStream in =
  10. new ObjectInputStream(
  11. new FileInputStream("file.x"));
  12. Object mystery = in.readObject();
  13. System.out.println(
  14. mystery.getClass().toString());
  15. }
  16. } ///:~

该程序能打开文件,并成功读取mystery对象中的内容。然而,一旦尝试查找与对象有关的任何资料——这要求AlienClass对象——Java虚拟机(JVM)便找不到Alien.class(除非它正好在类路径内,而本例理应相反)。这样就会得到一个名叫ClassNotFoundException的异常(同样地,若非能够校验Alien存在的证据,否则它等于消失)。

恢复了一个序列化的对象后,如果想对其做更多的事情,必须保证JVM能在本地类路径或者因特网的其他什么地方找到相关的.class文件。

10.9.2 序列化的控制

正如大家看到的那样,默认的序列化机制并不难操纵。然而,假若有特殊要求又该怎么办呢?我们可能有特殊的安全问题,不希望对象的某一部分序列化;或者某一个子对象完全不必序列化,因为对象恢复以后,那一部分需要重新创建。

此时,通过实现Externalizable接口,用它代替Serializable接口,便可控制序列化的具体过程。这个Externalizable接口扩展了Serializable,并增添了两个方法:writeExternal()readExternal()。在序列化和重新装配的过程中,会自动调用这两个方法,以便我们执行一些特殊操作。

下面这个例子展示了Externalizable接口方法的简单应用。注意Blip1Blip2几乎完全一致,除了极微小的差别(自己研究一下代码,看看是否能发现):

  1. //: Blips.java
  2. // Simple use of Externalizable & a pitfall
  3. import java.io.*;
  4. import java.util.*;
  5. class Blip1 implements Externalizable {
  6. public Blip1() {
  7. System.out.println("Blip1 Constructor");
  8. }
  9. public void writeExternal(ObjectOutput out)
  10. throws IOException {
  11. System.out.println("Blip1.writeExternal");
  12. }
  13. public void readExternal(ObjectInput in)
  14. throws IOException, ClassNotFoundException {
  15. System.out.println("Blip1.readExternal");
  16. }
  17. }
  18. class Blip2 implements Externalizable {
  19. Blip2() {
  20. System.out.println("Blip2 Constructor");
  21. }
  22. public void writeExternal(ObjectOutput out)
  23. throws IOException {
  24. System.out.println("Blip2.writeExternal");
  25. }
  26. public void readExternal(ObjectInput in)
  27. throws IOException, ClassNotFoundException {
  28. System.out.println("Blip2.readExternal");
  29. }
  30. }
  31. public class Blips {
  32. public static void main(String[] args) {
  33. System.out.println("Constructing objects:");
  34. Blip1 b1 = new Blip1();
  35. Blip2 b2 = new Blip2();
  36. try {
  37. ObjectOutputStream o =
  38. new ObjectOutputStream(
  39. new FileOutputStream("Blips.out"));
  40. System.out.println("Saving objects:");
  41. o.writeObject(b1);
  42. o.writeObject(b2);
  43. o.close();
  44. // Now get them back:
  45. ObjectInputStream in =
  46. new ObjectInputStream(
  47. new FileInputStream("Blips.out"));
  48. System.out.println("Recovering b1:");
  49. b1 = (Blip1)in.readObject();
  50. // OOPS! Throws an exception:
  51. //! System.out.println("Recovering b2:");
  52. //! b2 = (Blip2)in.readObject();
  53. } catch(Exception e) {
  54. e.printStackTrace();
  55. }
  56. }
  57. } ///:~

该程序输出如下:

  1. Constructing objects:
  2. Blip1 Constructor
  3. Blip2 Constructor
  4. Saving objects:
  5. Blip1.writeExternal
  6. Blip2.writeExternal
  7. Recovering b1:
  8. Blip1 Constructor
  9. Blip1.readExternal

未恢复Blip2对象的原因是那样做会导致一个异常。你找出了Blip1Blip2之间的区别吗?Blip1的构造器是“公共的”(public),Blip2的构造器则不然,这样便会在恢复时造成异常。试试将Blip2的构造器属性变成public,然后删除//!注释标记,看看是否能得到正确的结果。

恢复b1后,会调用Blip1默认构造器。这与恢复一个Serializable(可序列化)对象不同。在后者的情况下,对象完全以它保存下来的二进制位为基础恢复,不存在构造器调用。而对一个Externalizable对象,所有普通的默认构建行为都会发生(包括在字段定义时的初始化),而且会调用readExternal()。必须注意这一事实——特别注意所有默认的构建行为都会进行——否则很难在自己的Externalizable对象中产生正确的行为。

下面这个例子揭示了保存和恢复一个Externalizable对象必须做的全部事情:

  1. //: Blip3.java
  2. // Reconstructing an externalizable object
  3. import java.io.*;
  4. import java.util.*;
  5. class Blip3 implements Externalizable {
  6. int i;
  7. String s; // No initialization
  8. public Blip3() {
  9. System.out.println("Blip3 Constructor");
  10. // s, i not initialized
  11. }
  12. public Blip3(String x, int a) {
  13. System.out.println("Blip3(String x, int a)");
  14. s = x;
  15. i = a;
  16. // s & i initialized only in non-default
  17. // constructor.
  18. }
  19. public String toString() { return s + i; }
  20. public void writeExternal(ObjectOutput out)
  21. throws IOException {
  22. System.out.println("Blip3.writeExternal");
  23. // You must do this:
  24. out.writeObject(s); out.writeInt(i);
  25. }
  26. public void readExternal(ObjectInput in)
  27. throws IOException, ClassNotFoundException {
  28. System.out.println("Blip3.readExternal");
  29. // You must do this:
  30. s = (String)in.readObject();
  31. i =in.readInt();
  32. }
  33. public static void main(String[] args) {
  34. System.out.println("Constructing objects:");
  35. Blip3 b3 = new Blip3("A String ", 47);
  36. System.out.println(b3.toString());
  37. try {
  38. ObjectOutputStream o =
  39. new ObjectOutputStream(
  40. new FileOutputStream("Blip3.out"));
  41. System.out.println("Saving object:");
  42. o.writeObject(b3);
  43. o.close();
  44. // Now get it back:
  45. ObjectInputStream in =
  46. new ObjectInputStream(
  47. new FileInputStream("Blip3.out"));
  48. System.out.println("Recovering b3:");
  49. b3 = (Blip3)in.readObject();
  50. System.out.println(b3.toString());
  51. } catch(Exception e) {
  52. e.printStackTrace();
  53. }
  54. }
  55. } ///:~

其中,字段si只在第二个构造器中初始化,不关默认构造器的事。这意味着假如不在readExternal中初始化si,它们就会成为null(因为在对象创建的第一步中已将对象的存储空间清除为1)。若注释掉跟随于"You must do this"后面的两行代码,并运行程序,就会发现当对象恢复以后,snull,而i是零。

若从一个Externalizable对象继承,通常需要调用writeExternal()readExternal()的基类版本,以便正确地保存和恢复基类组件。

所以为了让一切正常运作起来,千万不可仅在writeExternal()方法执行期间写入对象的重要数据(没有默认的行为可用来为一个Externalizable对象写入所有成员对象)的,而是必须在readExternal()方法中也恢复那些数据。初次操作时可能会有些不习惯,因为Externalizable对象的默认构建行为使其看起来似乎正在进行某种存储与恢复操作。但实情并非如此。

(1) transient(临时)关键字

控制序列化过程时,可能有一个特定的子对象不愿让Java的序列化机制自动保存与恢复。一般地,若那个子对象包含了不想序列化的敏感信息(如密码),就会面临这种情况。即使那种信息在对象中具有private(私有)属性,但一旦经序列化处理,人们就可以通过读取一个文件,或者拦截网络传输得到它。

为防止对象的敏感部分被序列化,一个办法是将自己的类实现为Externalizable,就象前面展示的那样。这样一来,没有任何东西可以自动序列化,只能在writeExternal()明确序列化那些需要的部分。

然而,若操作的是一个Serializable对象,所有序列化操作都会自动进行。为解决这个问题,可以用transient(临时)逐个字段地关闭序列化,它的意思是“不要麻烦你(指自动机制)保存或恢复它了——我会自己处理的”。

例如,假设一个Login对象包含了与一个特定的登录会话有关的信息。校验登录的合法性时,一般都想将数据保存下来,但不包括密码。为做到这一点,最简单的办法是实现Serializable,并将password字段设为transient。下面是具体的代码:

  1. //: Logon.java
  2. // Demonstrates the "transient" keyword
  3. import java.io.*;
  4. import java.util.*;
  5. class Logon implements Serializable {
  6. private Date date = new Date();
  7. private String username;
  8. private transient String password;
  9. Logon(String name, String pwd) {
  10. username = name;
  11. password = pwd;
  12. }
  13. public String toString() {
  14. String pwd =
  15. (password == null) ? "(n/a)" : password;
  16. return "logon info: \n " +
  17. "username: " + username +
  18. "\n date: " + date.toString() +
  19. "\n password: " + pwd;
  20. }
  21. public static void main(String[] args) {
  22. Logon a = new Logon("Hulk", "myLittlePony");
  23. System.out.println( "logon a = " + a);
  24. try {
  25. ObjectOutputStream o =
  26. new ObjectOutputStream(
  27. new FileOutputStream("Logon.out"));
  28. o.writeObject(a);
  29. o.close();
  30. // Delay:
  31. int seconds = 5;
  32. long t = System.currentTimeMillis()
  33. + seconds * 1000;
  34. while(System.currentTimeMillis() < t)
  35. ;
  36. // Now get them back:
  37. ObjectInputStream in =
  38. new ObjectInputStream(
  39. new FileInputStream("Logon.out"));
  40. System.out.println(
  41. "Recovering object at " + new Date());
  42. a = (Logon)in.readObject();
  43. System.out.println( "logon a = " + a);
  44. } catch(Exception e) {
  45. e.printStackTrace();
  46. }
  47. }
  48. } ///:~

可以看到,其中的dateusername字段保持原始状态(未设成transient),所以会自动序列化。然而,password被设为transient,所以不会自动保存到磁盘;另外,自动序列化机制也不会作恢复它的尝试。输出如下:

  1. logon a = logon info:
  2. username: Hulk
  3. date: Sun Mar 23 18:25:53 PST 1997
  4. password: myLittlePony
  5. Recovering object at Sun Mar 23 18:25:59 PST 1997
  6. logon a = logon info:
  7. username: Hulk
  8. date: Sun Mar 23 18:25:53 PST 1997
  9. password: (n/a)

一旦对象恢复成原来的样子,password字段就会变成null。注意必须用toString()检查password是否为null,因为若用重载的+运算符来装配一个String对象,而且那个运算符遇到一个null引用,就会造成一个名为NullPointerException的异常(新版Java可能会提供避免这个问题的代码)。

我们也发现date字段被保存到磁盘,并从磁盘恢复,没有重新生成。

由于Externalizable对象默认时不保存它的任何字段,所以transient关键字只能伴随Serializable使用。

(2) Externalizable的替代方法

若不是特别在意要实现Externalizable接口,还有另一种方法可供选用。我们可以实现Serializable接口,并添加(注意是“添加”,而非“覆盖”或者“实现”)名为writeObject()readObject()的方法。一旦对象被序列化或者重新装配,就会分别调用那两个方法。也就是说,只要提供了这两个方法,就会优先使用它们,而不考虑默认的序列化机制。
这些方法必须含有下列准确的签名:

  1. private void
  2. writeObject(ObjectOutputStream stream)
  3. throws IOException;
  4. private void
  5. readObject(ObjectInputStream stream)
  6. throws IOException, ClassNotFoundException

从设计的角度出发,情况变得有些扑朔迷离。首先,大家可能认为这些方法不属于基类或者Serializable接口的一部分,它们应该在自己的接口中得到定义。但请注意它们被定义成private,这意味着它们只能由这个类的其他成员调用。然而,我们实际并不从这个类的其他成员中调用它们,而是由ObjectOutputStreamObjectInputStreamwriteObject()readObject()方法来调用我们对象的writeObject()readObject()方法(注意我在这里用了很大的抑制力来避免使用相同的方法名——因为怕混淆)。大家可能奇怪ObjectOutputStreamObjectInputStream如何有权访问我们的类的private方法——只能认为这是序列化机制玩的一个把戏。

在任何情况下,接口中的定义的任何东西都会自动具有public属性,所以假若writeObject()readObject()必须为private,那么它们不能成为接口(interface)的一部分。但由于我们准确地加上了签名,所以最终的效果实际与实现一个接口是相同的。

看起来似乎我们调用ObjectOutputStream.writeObject()的时候,我们传递给它的Serializable对象似乎会被检查是否实现了自己的writeObject()。若答案是肯定的是,便会跳过常规的序列化过程,并调用writeObject()readObject()也会遇到同样的情况。

还存在另一个问题。在我们的writeObject()内部,可以调用defaultWriteObject(),从而决定采取默认的writeObject()行动。类似地,在readObject()内部,可以调用defaultReadObject()。下面这个简单的例子演示了如何对一个Serializable对象的存储与恢复进行控制:

  1. //: SerialCtl.java
  2. // Controlling serialization by adding your own
  3. // writeObject() and readObject() methods.
  4. import java.io.*;
  5. public class SerialCtl implements Serializable {
  6. String a;
  7. transient String b;
  8. public SerialCtl(String aa, String bb) {
  9. a = "Not Transient: " + aa;
  10. b = "Transient: " + bb;
  11. }
  12. public String toString() {
  13. return a + "\n" + b;
  14. }
  15. private void
  16. writeObject(ObjectOutputStream stream)
  17. throws IOException {
  18. stream.defaultWriteObject();
  19. stream.writeObject(b);
  20. }
  21. private void
  22. readObject(ObjectInputStream stream)
  23. throws IOException, ClassNotFoundException {
  24. stream.defaultReadObject();
  25. b = (String)stream.readObject();
  26. }
  27. public static void main(String[] args) {
  28. SerialCtl sc =
  29. new SerialCtl("Test1", "Test2");
  30. System.out.println("Before:\n" + sc);
  31. ByteArrayOutputStream buf =
  32. new ByteArrayOutputStream();
  33. try {
  34. ObjectOutputStream o =
  35. new ObjectOutputStream(buf);
  36. o.writeObject(sc);
  37. // Now get it back:
  38. ObjectInputStream in =
  39. new ObjectInputStream(
  40. new ByteArrayInputStream(
  41. buf.toByteArray()));
  42. SerialCtl sc2 = (SerialCtl)in.readObject();
  43. System.out.println("After:\n" + sc2);
  44. } catch(Exception e) {
  45. e.printStackTrace();
  46. }
  47. }
  48. } ///:~

在这个例子中,一个String保持原始状态,其他设为transient(临时),以便证明非临时字段会被defaultWriteObject()方法自动保存,而transient字段必须在程序中明确保存和恢复。字段是在构造器内部初始化的,而不是在定义的时候,这证明了它们不会在重新装配的时候被某些自动化机制初始化。

若准备通过默认机制写入对象的非transient部分,那么必须调用defaultWriteObject(),令其作为writeObject()中的第一个操作;并调用defaultReadObject(),令其作为readObject()的第一个操作。这些都是不常见的调用方法。举个例子来说,当我们为一个ObjectOutputStream调用defaultWriteObject()的时候,而且没有为其传递参数,就需要采取这种操作,使其知道对象的引用以及如何写入所有非transient的部分。这种做法非常不便。

transient对象的存储与恢复采用了我们更熟悉的代码。现在考虑一下会发生一些什么事情。在main()中会创建一个SerialCtl对象,随后会序列化到一个ObjectOutputStream里(注意这种情况下使用的是一个缓冲区,而非文件——与ObjectOutputStream完全一致)。正式的序列化操作是在下面这行代码里发生的:

  1. o.writeObject(sc);

其中,writeObject()方法必须核查sc,判断它是否有自己的writeObject()方法(不是检查它的接口——它根本就没有,也不是检查类的类型,而是利用反射方法实际搜索方法)。若答案是肯定的,就使用那个方法。类似的情况也会在readObject()上发生。或许这是解决问题唯一实际的方法,但确实显得有些古怪。

(3) 版本问题

有时候可能想改变一个可序列化的类的版本(比如原始类的对象可能保存在数据库中)。尽管这种做法得到了支持,但一般只应在非常特殊的情况下才用它。此外,它要求操作者对背后的原理有一个比较深的认识,而我们在这里还不想达到这种深度。JDK 1.1的HTML文档对这一主题进行了非常全面的论述(可从Sun公司下载,但可能也成了Java开发包联机文档的一部分)。

10.9.3 利用“持久性”

一个比较诱人的想法是用序列化技术保存程序的一些状态信息,从而将程序方便地恢复到以前的状态。但在具体实现以前,有些问题是必须解决的。如果两个对象都有指向第三个对象的引用,该如何对这两个对象序列化呢?如果从两个对象序列化后的状态恢复它们,第三个对象的引用只会出现在一个对象身上吗?如果将这两个对象序列化成独立的文件,然后在代码的不同部分重新装配它们,又会得到什么结果呢?

下面这个例子对上述问题进行了很好的说明:

  1. //: MyWorld.java
  2. import java.io.*;
  3. import java.util.*;
  4. class House implements Serializable {}
  5. class Animal implements Serializable {
  6. String name;
  7. House preferredHouse;
  8. Animal(String nm, House h) {
  9. name = nm;
  10. preferredHouse = h;
  11. }
  12. public String toString() {
  13. return name + "[" + super.toString() +
  14. "], " + preferredHouse + "\n";
  15. }
  16. }
  17. public class MyWorld {
  18. public static void main(String[] args) {
  19. House house = new House();
  20. Vector animals = new Vector();
  21. animals.addElement(
  22. new Animal("Bosco the dog", house));
  23. animals.addElement(
  24. new Animal("Ralph the hamster", house));
  25. animals.addElement(
  26. new Animal("Fronk the cat", house));
  27. System.out.println("animals: " + animals);
  28. try {
  29. ByteArrayOutputStream buf1 =
  30. new ByteArrayOutputStream();
  31. ObjectOutputStream o1 =
  32. new ObjectOutputStream(buf1);
  33. o1.writeObject(animals);
  34. o1.writeObject(animals); // Write a 2nd set
  35. // Write to a different stream:
  36. ByteArrayOutputStream buf2 =
  37. new ByteArrayOutputStream();
  38. ObjectOutputStream o2 =
  39. new ObjectOutputStream(buf2);
  40. o2.writeObject(animals);
  41. // Now get them back:
  42. ObjectInputStream in1 =
  43. new ObjectInputStream(
  44. new ByteArrayInputStream(
  45. buf1.toByteArray()));
  46. ObjectInputStream in2 =
  47. new ObjectInputStream(
  48. new ByteArrayInputStream(
  49. buf2.toByteArray()));
  50. Vector animals1 = (Vector)in1.readObject();
  51. Vector animals2 = (Vector)in1.readObject();
  52. Vector animals3 = (Vector)in2.readObject();
  53. System.out.println("animals1: " + animals1);
  54. System.out.println("animals2: " + animals2);
  55. System.out.println("animals3: " + animals3);
  56. } catch(Exception e) {
  57. e.printStackTrace();
  58. }
  59. }
  60. } ///:~

这里一件有趣的事情是也许是能针对一个字节数组应用对象的序列化,从而实现对任何Serializable(可序列化)对象的一个“全面复制”(全面复制意味着复制的是整个对象网,而不仅是基本对象和它的引用)。复制问题将在第12章进行全面讲述。

Animal对象包含了类型为House的字段。在main()中,会创建这些Animal的一个Vector,并对其序列化两次,分别送入两个不同的数据流内。这些数据重新装配并打印出来后,可看到下面这样的结果(对象在每次运行时都会处在不同的内存位置,所以每次运行的结果有区别):

  1. animals: [Bosco the dog[Animal@1cc76c], House@1cc769
  2. , Ralph the hamster[Animal@1cc76d], House@1cc769
  3. , Fronk the cat[Animal@1cc76e], House@1cc769
  4. ]
  5. animals1: [Bosco the dog[Animal@1cca0c], House@1cca16
  6. , Ralph the hamster[Animal@1cca17], House@1cca16
  7. , Fronk the cat[Animal@1cca1b], House@1cca16
  8. ]
  9. animals2: [Bosco the dog[Animal@1cca0c], House@1cca16
  10. , Ralph the hamster[Animal@1cca17], House@1cca16
  11. , Fronk the cat[Animal@1cca1b], House@1cca16
  12. ]
  13. animals3: [Bosco the dog[Animal@1cca52], House@1cca5c
  14. , Ralph the hamster[Animal@1cca5d], House@1cca5c
  15. , Fronk the cat[Animal@1cca61], House@1cca5c
  16. ]

当然,我们希望装配好的对象有与原来不同的地址。但注意在animals1animals2中出现了相同的地址,其中包括共享的、对House对象的引用。在另一方面,当animals3恢复以后,系统没有办法知道另一个流内的对象是第一个流内对象的化身,所以会产生一个完全不同的对象网。

只要将所有东西都序列化到单独一个数据流里,就能恢复获得与以前写入时完全一样的对象网,不会不慎造成对象的重复。当然,在写第一个和最后一个对象的时间之间,可改变对象的状态,但那必须由我们明确采取操作——序列化时,对象会采用它们当时的任何状态(包括它们与其他对象的连接关系)写入。

若想保存系统状态,最安全的做法是当作一种“微观”操作序列化。如果序列化了某些东西,再去做其他一些工作,再来序列化更多的东西,以此类推,那么最终将无法安全地保存系统状态。相反,应将构成系统状态的所有对象都置入单个集合内,并在一次操作里完成那个集合的写入。这样一来,同样只需一次方法调用,即可成功恢复之。

下面这个例子是一套假想的计算机辅助设计(CAD)系统,对这一方法进行了很好的演示。此外,它还为我们引入了static字段的问题——如留意联机文档,就会发现ClassSerializable(可序列化)的,所以只需简单地序列化Class对象,就能实现static字段的保存。这无论如何都是一种明智的做法。

  1. //: CADState.java
  2. // Saving and restoring the state of a
  3. // pretend CAD system.
  4. import java.io.*;
  5. import java.util.*;
  6. abstract class Shape implements Serializable {
  7. public static final int
  8. RED = 1, BLUE = 2, GREEN = 3;
  9. private int xPos, yPos, dimension;
  10. private static Random r = new Random();
  11. private static int counter = 0;
  12. abstract public void setColor(int newColor);
  13. abstract public int getColor();
  14. public Shape(int xVal, int yVal, int dim) {
  15. xPos = xVal;
  16. yPos = yVal;
  17. dimension = dim;
  18. }
  19. public String toString() {
  20. return getClass().toString() +
  21. " color[" + getColor() +
  22. "] xPos[" + xPos +
  23. "] yPos[" + yPos +
  24. "] dim[" + dimension + "]\n";
  25. }
  26. public static Shape randomFactory() {
  27. int xVal = r.nextInt() % 100;
  28. int yVal = r.nextInt() % 100;
  29. int dim = r.nextInt() % 100;
  30. switch(counter++ % 3) {
  31. default:
  32. case 0: return new Circle(xVal, yVal, dim);
  33. case 1: return new Square(xVal, yVal, dim);
  34. case 2: return new Line(xVal, yVal, dim);
  35. }
  36. }
  37. }
  38. class Circle extends Shape {
  39. private static int color = RED;
  40. public Circle(int xVal, int yVal, int dim) {
  41. super(xVal, yVal, dim);
  42. }
  43. public void setColor(int newColor) {
  44. color = newColor;
  45. }
  46. public int getColor() {
  47. return color;
  48. }
  49. }
  50. class Square extends Shape {
  51. private static int color;
  52. public Square(int xVal, int yVal, int dim) {
  53. super(xVal, yVal, dim);
  54. color = RED;
  55. }
  56. public void setColor(int newColor) {
  57. color = newColor;
  58. }
  59. public int getColor() {
  60. return color;
  61. }
  62. }
  63. class Line extends Shape {
  64. private static int color = RED;
  65. public static void
  66. serializeStaticState(ObjectOutputStream os)
  67. throws IOException {
  68. os.writeInt(color);
  69. }
  70. public static void
  71. deserializeStaticState(ObjectInputStream os)
  72. throws IOException {
  73. color = os.readInt();
  74. }
  75. public Line(int xVal, int yVal, int dim) {
  76. super(xVal, yVal, dim);
  77. }
  78. public void setColor(int newColor) {
  79. color = newColor;
  80. }
  81. public int getColor() {
  82. return color;
  83. }
  84. }
  85. public class CADState {
  86. public static void main(String[] args)
  87. throws Exception {
  88. Vector shapeTypes, shapes;
  89. if(args.length == 0) {
  90. shapeTypes = new Vector();
  91. shapes = new Vector();
  92. // Add handles to the class objects:
  93. shapeTypes.addElement(Circle.class);
  94. shapeTypes.addElement(Square.class);
  95. shapeTypes.addElement(Line.class);
  96. // Make some shapes:
  97. for(int i = 0; i < 10; i++)
  98. shapes.addElement(Shape.randomFactory());
  99. // Set all the static colors to GREEN:
  100. for(int i = 0; i < 10; i++)
  101. ((Shape)shapes.elementAt(i))
  102. .setColor(Shape.GREEN);
  103. // Save the state vector:
  104. ObjectOutputStream out =
  105. new ObjectOutputStream(
  106. new FileOutputStream("CADState.out"));
  107. out.writeObject(shapeTypes);
  108. Line.serializeStaticState(out);
  109. out.writeObject(shapes);
  110. } else { // There's a command-line argument
  111. ObjectInputStream in =
  112. new ObjectInputStream(
  113. new FileInputStream(args[0]));
  114. // Read in the same order they were written:
  115. shapeTypes = (Vector)in.readObject();
  116. Line.deserializeStaticState(in);
  117. shapes = (Vector)in.readObject();
  118. }
  119. // Display the shapes:
  120. System.out.println(shapes);
  121. }
  122. } ///:~

Shape(几何形状)类“实现了可序列化”(implements Serializable),所以从Shape继承的任何东西也都会自动“可序列化”。每个Shape都包含了数据,而且每个派生的Shape类都包含了一个特殊的static字段,用于决定所有那些类型的Shape的颜色(如将一个static字段置入基类,结果只会产生一个字段,因为static字段未在派生类中复制)。可对基类中的方法进行覆盖处理,以便为不同的类型设置颜色(static方法不会动态绑定,所以这些都是普通的方法)。每次调用randomFactory()方法时,它都会创建一个不同的ShapeShape值采用随机值)。

Circle(圆)和Square(矩形)属于对Shape的直接扩展;唯一的差别是Circle在定义时会初始化颜色,而Square在构造器中初始化。Line(直线)的问题将留到以后讨论。

main()中,一个Vector用于容纳Class对象,而另一个用于容纳形状。若不提供相应的命令行参数,就会创建shapeTypes Vector,并添加Class对象。然后创建shapes Vector,并添加Shape对象。接下来,所有static color值都会设成GREEN,而且所有东西都会序列化到文件CADState.out

若提供了一个命令行参数(假设CADState.out),便会打开那个文件,并用它恢复程序的状态。无论在哪种情况下,结果产生的ShapeVector都会打印出来。下面列出它某一次运行的结果:

  1. >java CADState
  2. [class Circle color[3] xPos[-51] yPos[-99] dim[38]
  3. , class Square color[3] xPos[2] yPos[61] dim[-46]
  4. , class Line color[3] xPos[51] yPos[73] dim[64]
  5. , class Circle color[3] xPos[-70] yPos[1] dim[16]
  6. , class Square color[3] xPos[3] yPos[94] dim[-36]
  7. , class Line color[3] xPos[-84] yPos[-21] dim[-35]
  8. , class Circle color[3] xPos[-75] yPos[-43] dim[22]
  9. , class Square color[3] xPos[81] yPos[30] dim[-45]
  10. , class Line color[3] xPos[-29] yPos[92] dim[17]
  11. , class Circle color[3] xPos[17] yPos[90] dim[-76]
  12. ]
  13. >java CADState CADState.out
  14. [class Circle color[1] xPos[-51] yPos[-99] dim[38]
  15. , class Square color[0] xPos[2] yPos[61] dim[-46]
  16. , class Line color[3] xPos[51] yPos[73] dim[64]
  17. , class Circle color[1] xPos[-70] yPos[1] dim[16]
  18. , class Square color[0] xPos[3] yPos[94] dim[-36]
  19. , class Line color[3] xPos[-84] yPos[-21] dim[-35]
  20. , class Circle color[1] xPos[-75] yPos[-43] dim[22]
  21. , class Square color[0] xPos[81] yPos[30] dim[-45]
  22. , class Line color[3] xPos[-29] yPos[92] dim[17]
  23. , class Circle color[1] xPos[17] yPos[90] dim[-76]
  24. ]

从中可以看出,xPosyPos以及dim的值都已成功保存和恢复出来。但在获取static信息时却出现了问题。所有“3”都已进入,但没有正常地出来。Circle有一个1值(定义为RED),而Square有一个0值(记住,它们是在构造器里初始化的)。看上去似乎static根本没有得到初始化!实情正是如此——尽管类Class是“可以序列化的”,但却不能按我们希望的工作。所以假如想序列化static值,必须亲自动手。

这正是Line中的serializeStaticState()deserializeStaticState()两个static方法的用途。可以看到,这两个方法都是作为存储和恢复进程的一部分明确调用的(注意写入序列化文件和从中读回的顺序不能改变)。所以为了使CADState.java正确运行起来,必须采用下述三种方法之一:

(1) 为几何形状添加一个serializeStaticState()deserializeStaticState()

(2) 删除Vector shapeTypes以及与之有关的所有代码

(3) 在几何形状内添加对新序列化和撤消序列化静态方法的调用

要注意的另一个问题是安全,因为序列化处理也会将private数据保存下来。若有需要保密的字段,应将其标记成transient。但在这之后,必须设计一种安全的信息保存方法。这样一来,一旦需要恢复,就可以重设那些private变量。