格式 可分割 平均压缩速度 文本文件压缩效率 Hadoop压缩编码解释器 纯Java实现 原生 备注
    gzip org.apache.hadoop.io.compress.GzipCodec
    lzo 非常快 中等 com.hadoop.compression.lzo.LzoCodec 需要在每个节点安装LZO
    bzip2 非常高 org.apache.hadoop.io.compress.Bzip2Codec 为可分割版本使用纯Java
    zlib 中等 org.apache.hadoop.io.compress.DefaultCodec Hadoop的默认压缩编码器
    snappy 非常快 org.apache.hadoop.io.compress.SnappyCodec Snappy有纯Java的移植版