备份

停止hbase服务后,使用distcp命令运行MapReduce任务进行备份,将数据备份到另一个地方,可以是同一个集群,也可以是专用的备份集群.

即,数据转移到当前集群的其他目录下(也可以不在同一个集群中):

注意:执行这个操作,一定要开启yarn服务

  1. hadoop distcp \
  2. hdfs://master:8020/hbase \
  3. hdfs://master:8020/HbaseBackup/backup20171009

看输出有sourcePaths源文件夹和targetPath目标文件夹
源文件夹可以指定多个,目标文件夹只能一个

恢复

非常简单,与备份一样,将整个数据移动回来即可

  1. hadoop distcp \
  2. hdfs://master:8020/HbaseBackup/backup20171009 \
  3. hdfs://master:8020/hbase