完成Hadoop配置后,就可以初始化并启动Hadoop

1. 初始化

  1. hdfs namenode -format

如果没有在 /etc/profile 中配置Hadoop环境变量,需要使用 hdfs 的绝对路径替代示例命令; 此处使用的 hdfs 命令在 HADOOP_HOME/bin 目录下。

2. 启动

Hadoop操作相关的命令都在 HADOOP_HOME/bin 目录下,可以直接执行(不推荐)

start-all.sh

一般建议分两步:
(1)先启动 hdfs 服务

start-dfs.sh

启动后,可以使 jps 命令查看服务启动情况
(2)启动 YARN 服务

start-yarn.sh

以上两步完成后,使用 jps 命令查看结果如下:

master服务器:

[root@master sbin]# jps
26739 NodeManager
23861 NameNode
9781 Jps
34266 Bootstrap
24093 DataNode
26495 ResourceManager
[root@master sbin]#

slave1/slave2服务器:

[root@slave1 ~]# jps
15697 SecondaryNameNode
15482 DataNode
16734 NodeManager
5535 Jps
[root@slave1 ~]#

3. 访问

在访问Hadoop服务前,需要关闭集群服务器的防火墙

3.1 Hadoop服务

根据 yarn-site.xml 配置内容,可以访问 Hadoop 服务

http://ip:9870

Hadoop 3.3.0 默认访问端口为9870,旧版本Hadoop的默认访问端口为50070

3.2 Hadoop应用程序

http://ip:8088

yarn-site.xml 中配置的端口号位8088,可以自定义此端口