1. [官网]
    2. : https://hbase.apache.org/
    3. []
    4. // https://www.jianshu.com/p/53864dc3f7b4
    5. // https://www.cnblogs.com/raphael5200/p/5229164.html


    Hadoop Database ,是一个高可靠性、高性能、面向列、可伸缩、开源的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

    该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。HBase利用Hadoop HDFS作为其文件存储系统。
    
    就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
    

    HBase - 简介 - 图1

    其中,HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。
    
    HBase中的所有数据文件都存储在Hadoop HDFS文件系统上,主要包括两种文件类型,HFile, HBase中KeyValue数据的存储格式,HFile是Hadoop的二进制格式文件,实际上StoreFile就是对HFile做了轻量级包装,即StoreFile底层就是HFile;HLog File,HBase中WAL(Write Ahead Log) 的存储格式,物理上是Hadoop的Sequence File。
    

    HBase - 简介 - 图2