Hbase是一个高可靠性,高性能,面向列,可伸缩的分布式存储系统,目标是存储并处理大型数据;Hbase利用HDFS作为其文件存储系统,使用Hadoop MapReduce来处理Hbase中海量数据,使用zookeeper作为协同服务

特点

  1. 海量存储:适合存储 PB 级別的海量数据,在 PB 级別的数据以及采用廉价 PC 存储的情况下,能在几十到百亳秒内返回数据.
  2. 列式存储:族存储, Hbase 是根据列族来存储数据的。列族下面可以有非常多的列;列族在创建表的时候就必须指定
  3. 极易扩展:
    1. 一个是基于上层处理能力( RegionServer )的扩展:通过横向添加 RegionSever 的机器,进行水平扩展。提升 Hbase 上层的处理能力。提升 Hbase 服务更多 Region 的能力
    2. 一个是基于存储的扩展(HDFS ):横向添加 Datanode 的机器,进行存储层扩容
  4. 高并发:由于目前大部分使用 Hbase 的架构,都是采用的廉价 PC ,因此单个 IO 的延迟其实并不小,一般在几十到上百 ms 之间。这里说的高并发,主要是在并发的情况下, Hbase 的单个IO廷迟下降并不多。能获得高并发、低延迟的服务
  5. 稀疏:稀疏主要是针对 Hbase 列的灵活性,在列族中,你可以指定任意多的列,在列数据为空的情况下,是不会者用存储空间的

    架构

    image.png

    Shell操作

  6. 进入shell操作:bin/hbase shell

  • 帮助命令:help
  • 数据表查看:list