将配置1主 2从 Hadoop Multi Node Cluster 构架:
服务器名称 | 内部IP | HDFS | YARN |
---|---|---|---|
master | 192.168.56.100 | NameNode | ResourceManager |
data01 | 192.168.56.101 | DataNode | NodeManager |
data02 | 192.168.56.102 | DataNode | NodeManager |
1. 网络配置
- 复制 SingleNode 虚拟机,初始化所有网卡MAC地址;
若新建虚拟机可参照 0. Virtualbox+Centos8.md 进行网络配置;
- 修改网络配置,设置 IP;
CentOS
ssh-copy-id -i ~/.ssh/id_rsa.pub root@data01 ssh-copy-id -i ~/.ssh/id_rsa.pub root@data02
<br />data01 data02 服务器也需进行该操作,来实现三台服务器之间的免密登陆;
<a name="32f31fb3"></a>
## 2. 设置 data 服务器
1. 设置 hostname
```bash
sudo vim /etc/hostname
data01
- 编辑 hosts 文件 ```bash sudo vim /etc/hosts
192.168.56.100 master 192.168.56.101 data01 192.168.56.102 data02
3. 设置 core-site.xml<br />当程序存取 HDFS时,使用 `fs.default.name`作为目标节点
```bash
sudo vim /usr/local/hadoop/etc/hadoop/core-site.xml
- 设置 YARN-site.xml
MapReduce(YARN) 相关配置sudo vim /usr/local/hadoop/etc/hadoop/yarn-site.xml
- 设置 mapred-site.xml
sudo vim /usr/local/hadoop/etc/hadoop/mapred-site.xml
- 设置 hdfs-site.xml
sudo vim /usr/local/hadoop/etc/hadoop/hdfs-site.xml
- 复制 data01 到 data02 master, data02 修改 IP 和 hostname
3. 设置 master 服务器
master 由 data 镜像,若单独配置 master 服务器,除下述配置外,其他配置参照 data 配置即可;
- 设置 hostname
sudo vim /etc/hostname
master
- 编辑 hosts 文件
sudo vim /etc/hosts
192.168.56.100 master
192.168.56.101 data01
192.168.56.102 data02
- 设置 hdfs-site.xml
sudo vim /usr/local/hadoop/etc/hadoop/hdfs-site.xml
<configuration>
<!-- 设置 blocks 副本备份数量 -->
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<!-- 设置 NameNode 数据存储目录 -->
<property>
<name>dfs.namenode.data.dir</name>
<value>file:/usr/local/hadoop/hadoop_data/hdfs/namenode</value>
</property>
<!-- 任意网卡均可访问 -->
<property>
<name>dfs.http.address</name>
<value>0.0.0.0:50070</value>
</property>
</configuration>
- 设置 masters 文件
sudo vim /usr/local/hadoop/etc/hadoop/masters
master
- 设置 workers 文件
sudo vim /usr/local/hadoop/etc/hadoop/workers
data01
data02
4. 设置 HDFS
- DataNode 服务器
sudo rm -rf /usr/local/hadoop/hadoop_data/hdfs
mkdir -p /usr/local/hadoop/hadoop_data/hdfs/datanode
- NameNode 服务器
sudo rm -rf /usr/local/hadoop/hadoop_data/hdfs
mkdir -p /usr/local/hadoop/hadoop_data/hdfs/namenode
格式化 NameNode HDFS 目录
hadoop namenode -format
5. 测试
start-all.sh
- 使用
JPS
查看相关进程
- NameNode:
1585 NameNode
2007 ResourceManager
2312 Jps
1791 SecondaryNameNode
- DataNode:
1266 DataNode
1411 NodeManager
1542 Jps
- Hadoop ResourceManager Web:本机访问 localhost:8088 或 服务器IP:8088 ;
- HDFS Web: 本机访问 localhost:50070 或 服务器IP:50070 ;
- 若开启端口转发,2、3步骤中 端口号换为转发端口号;