1.1虚拟机环境准备

  1. 克隆虚拟机

安装模板虚拟机,IP地址192.168.10.100、主机名称hadoop100、内存4G硬盘20G

hadoop100虚拟机配置要求如下(本文Linux系统全部以CentOS-7.5-x86-1804为例)

1)卸载虚拟机自带的JDK**

[root@hadoop100 ~]# rpm -qa | grep -i java | xargs -n1 rpm -e —nodeps 安装JDK:

(1)在/opt目录下创建module、software文件夹

[root@hadoop100 ~]# mkdir /opt/module

[root@hadoop100 ~]# mkdir /opt/software

(2)用Xftp传输工具将JDK导入到opt目录下面的software文件夹下面

( 3) 解压JDK到/opt/module目录下

  1. [root@hadoop102 software]$ tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/

(4)配置环境变量

[root@hadoop102 ~]$ vim /etc/profile

添加如下内容

JAVA_HOME

export JAVA_HOME=/opt/module/jdk1.8.0_212

export PATH=$PATH:$JAVA_HOME/bin

(5)让环境变量生效

[root@hadoop102 ~]$ source /etc/profile (注意:分发后要在每台虚拟机上执行这个命令

(6)测试

输入命令 java -version

2. 修改克隆虚拟机的静态IP

vim /etc/sysconfig/network-scripts/ifcfg-ens33

3. 修改主机名(vim /etc/hostname)

记得重启虚拟机

修改windows的主机映射文件(hosts文件:C:\Windows\System32\drivers\etc

4. 关闭防火墙

[root@hadoop100 ~]# systemctl stop firewalld

( [root@hadoop100 ~]# systemctl disable firewalld.service)

5. 创建普通用户(可选)

6. 配置普通用户具有root权限(可选)

安装hadoop

1)用XFtp文件传输工具将hadoop-3.1.3.tar.gz导入到opt目录下面的software文件夹下面

2**进入到Hadoop安装包路径下**

[root@hadoop102 ~]$ cd /opt/software/

3**解压安装文件到/opt/module**下面

[root@hadoop102 software]$ tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/

4****查看是否解压成功

[root@hadoop102 software]$ ls /opt/module/

hadoop-3.1.3

5**Hadoop**添加到环境变量

  1. 1)获取Hadoop安装路径

[root@hadoop102 hadoop-3.1.3]$ pwd

/opt/module/hadoop-3.1.3

  1. 2)打开/etc/profile文件

[root@hadoop102 hadoop-3.1.3]$ vim /etc/profile

Ø 在my_env.sh文件末尾添加如下内容:(shift+g)

HADOOP_HOME

export HADOOP_HOME=/opt/module/hadoop-3.1.3

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

6**)测试是否安装成功**

[root@hadoop102 hadoop-3.1.3]$ hadoop version

Hadoop 3.1.3(成功则不需要重启)

本地运行模式(官方WordCount)

1**创建在hadoop-3.1.3文件下面创建一个wcinput**文件夹

[root@hadoop102 hadoop-3.1.3]$ mkdir wcinput

2**wcinput文件下创建一个word.txt文件**

[root@hadoop102 hadoop-3.1.3]$ cd wcinput

3**编辑word.txt文件**

[root@hadoop102 wcinput]$ vim word.txt

Ø 在文件中输入如下内容

hadoop yarn

hadoop mapreduce

root

root

Ø 保存退出::wq

4**回到Hadoop目录/opt/module/hadoop-3.1.3**

5****执行程序

[root@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount wcinput wcoutput

6****查看结果

[root@hadoop102 hadoop-3.1.3]$ cat wcoutput/part-r-00000

看到如下结果:

root 2

hadoop 2

mapreduce 1