一、相关概念

NameNode、DataNode

image.png

Secondary NameNode、Client

image.png

HDFS文件块大小

image.png
“如何设置合适的文件块大小”

二、操作命令

创建文件夹:hadoop fs -mkdir /sanguo

上传

-moveFromLocal

从本地剪切粘贴到HDFS:hadoop fs -moveFromLocal shuguo.txt /sanguo
image.pngimage.png
image.png

-copyFromLocal

从本地文件系统中拷贝文件到HDFS路径去:hadoop fs -copyFromLocal weiguo.txt /sanguo

-put

等同于copyFromLocal,生产环境更习惯用put:hadoop fs -put ./wuguo.txt /sanguo

-appendToFile

追加一个文件到已经存在的文件末尾:hadoop fs -appendToFile liubei.txt /sanguo/shuguo.txt
image.png

下载

-copyToLocal

从HDFS拷贝到本地:hadoop fs -copyToLocal /sanguo/shuguo.txt ./

-get

等同于copyToLocal,生产环境更习惯用get:hadoop fs -get /sanguo/shuguo.txt ./shuguo2.txt

HDFS直接操作

-ls: 显示目录信息 hadoop fs -ls /sanguo
-cat:显示文件内容 hadoop fs -cat /sanguo/shuguo.txt
-chgrp、-chmod、-chown
Linux文件系统中的用法一样,修改文件所属权限
image.png
hadoop fs -chown liaoxiang:liaoxiang /sanguo/shuguo.txt
image.png
-mkdir:创建路径 hadoop fs -mkdir /jinguo
-cp:从HDFS的一个路径拷贝到HDFS的另一个路径 hadoop fs -cp /sanguo/shuguo.txt /jinguo
-mv:在HDFS目录中移动文件 hadoop fs -mv /sanguo/wuguo.txt /jinguo
-tail:显示一个文件的末尾1kb的数据 hadoop fs -tail /jinguo/shuguo.txt
-rm:删除文件或文件夹 hadoop fs -rm /sanguo/shuguo.txt
-rm -r:递归删除目录及目录里面内容 hadoop fs -rm -r /sanguo
-du:统计文件夹的大小信息 hadoop fs -du -s -h /jinguo
image.png
三个文件总大小20,存在三个副本,总共60
image.png
查看每个文件大小
image.png
-setrep:设置HDFS中文件的副本数量 hadoop fs -setrep 10 /jinguo/shuguo.txt