5.1 启动Hadoop集群
5.1.1 格式化文件系统
如果集群是第一次启动,需要在hadoop102节点格式化NameNode。
注意:格式化NameNode,会产生新的集群id,导致NameNode和DataNode的集群id不一致,集群找不到已往数据。如果集群在运行过程中报错,需要重新格式化NameNode的话,一定要先停止namenode和datanode进程,并且要删除所有机器的data和logs目录,然后再进行格式化。
输入命令:hdfs namenode -format
5.1.2 启动Hadoop进程
Hadoop集群的启动,需要启动其内部的两个集群框架,HDFS集群和YARN集群。启动方式有单节点逐个启动和使用脚本一键启动两种。- 启动HDFS
- [li@hadoop102 sbin]$ start-dfs.sh
Starting namenodes on [hadoop102]
Starting datanodes
hadoop104: WARNING: /opt/module/hadoop-3.1.3/logs does not exist. Creating.
hadoop103: WARNING: /opt/module/hadoop-3.1.3/logs does not exist. Creating.
Starting secondary namenodes [hadoop104]
- 启动YARN
5.2.1 HDFS监控
Web端查看HDFS的NameNode:浏览器中输入:http://hadoop102:9870 ### 5.2.2 YARN监控 Web端查看YARN的ResourceManager:
][浏览器中输入:http://hadoop103:8088 ### 5.2.3 日志监控 Web端查看Hadoop的日志监控界面即JobHistroy:
在浏览器中地址栏中输入http://hadoop102:19888 5.3 Hadoop集群基本测试 5.3.1 上传文件到集群 创建input目录,上传小文件 [li@hadoop102 hadoop-3.1.3]$ hadoop fs -mkdir /input [li@hadoop102 hadoop-3.1.3]$ hadoop fs -put $HADOOP_HOME/wcinput/word.txt /input 2022-08-24 15:09:10,390 INFO sasl.SaslDataTransferClient: SASL encryption trust check: localHostTrusted = false, remoteHostTrusted = false 上传完成后可以在浏览器中查看内容: ### 5.3.2 查看文件 1. 查看HDFS文件存储路径 2. /opt/module/hadoop-3.1.3/data/dfs/data/current/BP-1775777091-192.168.10.132-1661323073082/current/finalized/subdir0/subdir0
5.4 停止Hadoop集群
5.4.1 各模块分开启动/停止
在配置ssh的前提下- 整体启动/停止HDFS
- start-dfs.sh/stop-dfs.sh
- 整体启动/停止YARN
- start-yarn.sh/stop-yarn.sh
5.4.2 各服务组件逐一启动/停止
分别启动/停止HDFS组件
hdfs —daemon start/stop namenode/datanode/secondarynamenode
1
启动/停止YARN
yarn —daemon start/stop resourcemanager/nodemanager