一、概述
二、序列化案例
- 2.1、自定义对象直接实现java的Serializable
- 2.2、实现Hadoop的序列化接口(Writable)

一、概述

1.1、什么是序列化

序列化就是把内存中的对象，转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。
反序列化就是将收到字节序列(或其他数据传输协议)或者是磁盘的持久化数据，转换成内存中的对象。

1.2、为什么要序列化

一般来说，“活的”对象只生存在内存里，关机断电就没有了。而且“活的” 对象只能由本地的进程使用，不能被发送到网络上的另外一台计算机。然而序列化可以存储“活的”对象，可以将“活的”对象发送到远程计算机

1.3、为什么不用Java的序列化

Java的序列化是一个重量级序列化框架(Serializable)，一个对象被序列化后，会附带很多额外的信息(各种校验信息，Header，继承体系等)，不便于在网络中高效传输。所以，Hadoop自己开发了一套序列化机制(Writable)。

Hadoop序列化特点:

紧凑 :高效使用存储空间
快速:读写数据的额外开销小
可扩展:随着通信协议的升级而可升级
互操作:支持多语言的交互

二、序列化案例

2.1、自定义对象直接实现java的Serializable

2.2、实现Hadoop的序列化接口(Writable)

具体实现 bean 对象序列化步骤如下 7 步：

必须实现 Writable 接口
反序列化时，需要反射调用空参构造函数，所以必须有空参构造
重写序列化方法
重写反序列化方法
注意反序列化的顺序和序列化的顺序完全一致
要想把结果显示在文件中，需要重写 toString()，可用”\t”分开，方便后续用。
如果需要将自定义的 bean 放在 key 中传输，则还需要实现 Comparable 接口，因为MapReduce 框中的 Shuffle 过程要求对 key 必须能排序。

案例：

// 1 实现 writable 接口
public class FlowBean implements Writable{
  private long upFlow;
  private long downFlow;
  private long sumFlow;
    //2 反序列化时，需要反射调用空参构造函数，所以必须有 
  public FlowBean() {
        super(); 
  }
  public FlowBean(long upFlow, long downFlow) {
    super();
    this.upFlow = upFlow; 
    this.downFlow = downFlow; 
    this.sumFlow = upFlow + downFlow;
  }
    //3 重写序列化方法
  @Override
  public void write(DataOutput out) throws IOException {
     out.writeLong(upFlow);
     out.writeLong(downFlow);
     out.writeLong(sumFlow);
  }
//4 重反序列化方法
//5 反序列化方法读顺序必须和写序列化方法的写顺序必须一致
  @Override
  public void readFields(DataInput in) throws IOException {
      this.upFlow = in.readLong(); 
    this.downFlow = in.readLong(); 
    this.sumFlow = in.readLong();
  }
  // 6 编写 toString 方法，方便后续打印到文本 @Override
  public String toString() {
      return upFlow + "\t" + downFlow + "\t" + sumFlow; 
  }
  public long getUpFlow() {
     return upFlow;
  }
  public void setUpFlow(long upFlow) { 
    this.upFlow = upFlow;
  }
  public long getDownFlow() {
     return downFlow;
  }
  public void setDownFlow(long downFlow) {
    this.downFlow = downFlow;
  }
  public long getSumFlow() {
    return sumFlow;
  }
  public void setSumFlow(long sumFlow) { 
    this.sumFlow = sumFlow;
  } 
}

大数据

三、Hadoop序列化