备份
停止hbase服务后,使用distcp命令运行MapReduce任务进行备份,将数据备份到另一个地方,可以是同一个集群,也可以是专用的备份集群.
即,数据转移到当前集群的其他目录下(也可以不在同一个集群中):
注意:执行这个操作,一定要开启yarn服务
hadoop distcp \
hdfs://master:8020/hbase \
hdfs://master:8020/HbaseBackup/backup20171009
看输出有sourcePaths源文件夹和targetPath目标文件夹
源文件夹可以指定多个,目标文件夹只能一个
恢复
非常简单,与备份一样,将整个数据移动回来即可
hadoop distcp \
hdfs://master:8020/HbaseBackup/backup20171009 \
hdfs://master:8020/hbase