本文档在最小化安装centos7后的操作。

首先,对于大数据集群提前进行主机名、IP地址、主次服务的规划:

node01 :192.168.3.80 NN DN

node02 :192.168.3.81 DN

node03 :192.168.3.82 DN SN

其中安装第一台机器时,建议在安装时就指定主机名,IP地址根据自己的局域网情况填写

  1. sudo yum install net-tools
  2. sudo yum install vim
  3. sudo vim /etc/vimrc

添加 set ts=4

2、系统准备:

  1. sudo systemctl stop firewalld.service
  2. sudo systemctl disable firewalld.service
  1. sudo vim /etc/selinux/config

修改为 SELINUX=disabled

2.3、源码环境准备

在家目录下,创建soft目录,拷贝jdk的rpm包和hadoop的tar包

  1. sudo rpm -ivh jdk-8u281-linux-x64.rpm
  2. sudo tar -zxvf hadoop-2.7.1.tar.gz -C /opt/
  1. sudo vim /etc/profile.d/hadoop.sh
  2. export HADOOP_HOME=/opt/hadoop-2.7.1
  3. export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
  1. cd /opt
  2. sudo chown -R huser:huser /opt/hadoop-2.7.1
  1. sudo mkdir /var/big_data
  2. sudo chown -R huser:huser /var/big_data

3、hadoop系统配置

本内容主要针对Hadoop的配置文件进行修改,修改原则和最开始的服务搭建要一致
  1. 进入/opt/hadoop-2.7.1/etc/hadoop目录
  1. vim hadoop-env.sh
  2. export JAVA_HOME=/usr/java/default

主要目的是解决远程访问hadoop时候JAVA_HOME无法继承的问题

  1. vim yarn-env.sh
  2. export JAVA_HOME=/usr/java/default
  1. vim core-site.xml
  2. <property>
  3. <name>fs.defaultFS</name>
  4. <value>hdfs://node01:9000</value>
  5. </property>
  6. <property>
  7. <name>hadoop.tmp.dir</name>
  8. <value>/var/big_data</value>
  9. </property>
  1. vim hdfs-site.xml
  2. <property>
  3. <name>dfs.replication</name>
  4. <value>2</value>
  5. </property>
  6. <property>
  7. <name>dfs.namenode.secondary.http-address</name>
  8. <value>node03:50090</value>
  9. </property>
  1. vim mapred-site.xml
  2. <property>
  3. <name>mapreduce.framework.name</name>
  4. <value>yarn</value>
  5. </property>
  1. vim yarn-site.xml
  2. <property>
  3. <name>yarn.nodemanager.aux-services</name>
  4. <value>mapreduce_shuffle</value>
  5. </property>
  6. <property>
  7. <name>yarn.resourcemanager.hostname</name>
  8. <value>node01</value>
  9. </property>
  1. vim slaves
  2. node01
  3. node02
  4. node03

4、提前准备主机名解析文件,为后面的克隆机器做好准备(可选,若不做,克隆后为每台机器重新添加亦可)

sudo vim /etc/hosts

  1. 192.168.3.80 node01
  2. 192.168.3.81 node02
  3. 192.168.3.82 node03
  4. 注意屏蔽或删除上面的127.0.0.1的信息

5、克隆其他集群信息

关闭机器,准备克隆

  1. 克隆后,修改node02node03IP和主机名
  2. sudo vim /etc/sysconfig/networ-scripts/ifcfg-ens33
  3. sudo vim /etc/hostname

6、下面开始配置集群的ssh免密

在3台机器上执行产生自己的公钥:

  1. ssh-keygen -t rsa
  2. 按照默认值回车确定
  3. 将每台机器的公钥拷贝给每台机器,注意下面的指令要求3台机器都要执行:
  4. ssh-copy-id node01
  5. ssh-copy-id node02
  6. ssh-copy-id node03

7、格式化hdfs

hdfs namenode -format

搭配视频教程

bilibili