学习链接:https://www.bilibili.com/video/BV1Qp4y1n7EN?p=18&spm_id_from=pageDriver


安装VMware

QQ截图20220426094403.png

安装CentOS

1. 创建虚拟机

  1. 1. 选自定义

QQ截图20220426094638.png

  1. 稍后安装操作系统

QQ截图20220426094841.png

  1. 将安装Linux系统,CentOS 7 64位

QQ截图20220426095002.png

  1. 更改虚拟机名称

QQ截图20220427154944.png

  1. 处理器数量和每个处理器的内核数量相乘不能超过物理机的cpu个数

QQ截图20220426095305.png

  1. 配置虚拟内存

QQ截图20220426095710.png

  1. 网络类型选择使用网络地址转换(NAT)

QQ截图20220426095735.png

2. 安装系统前检查虚拟机的bios的虚拟化是不是打开的

QQ截图20220426100509.png

3. 安装操作系统

  1. 选择cd/dvd的方式安装系统

QQ截图20220426101532.png

  1. 开启虚拟机开始安装系统

QQ截图20220426101615.png

  1. 设置语言

QQ截图20220426101916.png

  1. 选择软件GNOME桌面

QQ截图20220426102217.png

  1. 配置磁盘分区

QQ截图20220426102526.png

  1. 添加boot区

QQ截图20220426102623.png
QQ截图20220426102715.png
QQ截图20220426102855.png

  1. 添加swap交换分区

QQ截图20220426103007.png

  1. 根目录分区

QQ截图20220426103037.png

  1. 关闭kdump

QQ截图20220426103303.png

  1. 修改主机名,打开网络

QQ截图20220426103417.png

  1. 安装,设置账号密码,完成后重启虚拟机

QQ截图20220426104307.png
QQ截图20220426104638.png

4. 网络配置

4.1 配置VMware的IP

  1. 编辑—>虚拟网络编辑器

QQ截图20220426105308.png
QQ截图20220426105607.png

4.2 Windows的网络配置

QQ截图20220426105847.png
QQ截图20220426110110.png

4.3 虚拟机网络IP修改地址配置

  1. 右键->打开终端->输入 su root 和密码,切换到root用户

QQ截图20220426110441.png

  1. vim /etc/sysconfig/network-scripts/ifcfg-ens33 修改网络IP地址为静态IP地址

QQ截图20220426110729.png
QQ截图20220426111507.png
esc :wq退出

  1. vim /etc/hostname 修改主机名称7d56a385-dbc1-42d4-bcc8-b2970b2ac730.png
  2. 主机名称映射 vim /etc/hosts

添加:

  1. 192.168.10.100 hadoop100
  2. 192.168.10.101 hadoop101
  3. 192.168.10.102 hadoop102
  4. 192.168.10.103 hadoop103
  5. 192.168.10.104 hadoop104
  6. 192.168.10.105 hadoop105
  7. 192.168.10.106 hadoop106
  8. 192.168.10.107 hadoop107
  9. 192.168.10.108 hadoop108

QQ截图20220426112814.png

  1. 重启 登录root账号

QQ截图20220426113129.png

  1. 验证ip地址和对应主机名称 ifconfig

QQ截图20220426113422.png

  1. 验证网络是否畅通 ping www.baidu.com

QQ截图20220426113548.png

安装远程访问工具 Xshell

  1. 下载链接:https://xshell.en.softonic.com/ 安装

QQ截图20220426173128.png

  1. 新建会话 设置名称和主机

QQ截图20220426173331.png

  1. 设置用户名和密码

QQ截图20220426173422.png
QQ截图20220426173652.png

  1. 修改windows的主机映射文件(hosts文件)

    1. 进入C:\Windows\System32\drivers\etc路径
    2. 打开hosts文件并添加
      1. 192.168.10.100 hadoop100
      2. 192.168.10.101 hadoop101
      3. 192.168.10.102 hadoop102
      4. 192.168.10.103 hadoop103
      5. 192.168.10.104 hadoop104
      6. 192.168.10.105 hadoop105
      7. 192.168.10.106 hadoop106
      8. 192.168.10.107 hadoop107
      9. 192.168.10.108 hadoop108
  2. 再加一个会话 以hadoop命名

    安装Xftp 用于win和linux通信

    安装
    QQ截图20220426175350.png

    hadoop100虚拟机配置——模板虚拟机

  3. 测试网络是否畅通

QQ截图20220426181152.png

  1. 安装epel-release

Extra Packages for Enterprise Linux是为“红帽系”的操作系统提供额外的软件包,适用于RHEL、CentOS和Scientific Linux。相当于是一个软件仓库,大多数rpm包在官方 repository 中是找不到的)

  1. yum install -y epel-release
  1. 关闭防火墙,关闭防火墙开机自启

    1. systemctl stop firewalld
    2. systemctl disable firewalld.service
  2. 给自己创的用户root权限

    1. 打开/etc/sudoers文件

      1. vim /etc/sudoers
    2. 修改/etc/sudoers文件,在%wheel这行下面添加一行:

      1. qtbhy ALL=(ALL) NOPASSWD:ALL
    3. 测试一下:

      1. [root@hadoop100 ~]# cd /opt/
      2. [root@hadoop100 opt]# ll
      3. 总用量 0
      4. drwxr-xr-x. 2 root root 6 9 7 2017 rh
      5. [root@hadoop100 opt]# exit
      6. exit
      7. [qtbhy@hadoop100 ~]$ cd /opt/
      8. [qtbhy@hadoop100 opt]$ ll
      9. 总用量 0
      10. drwxr-xr-x. 2 root root 6 9 7 2017 rh
      11. [qtbhy@hadoop100 opt]$ rm -rf rh/
      12. rm: 无法删除"rh/": 权限不够
      13. [qtbhy@hadoop100 opt]$ sudo rm -rf rh/ 使用sudo删除
      14. [qtbhy@hadoop100 opt]$ ll
      15. 总用量 0
  3. 在/opt目录下创建文件夹,并修改所有者和所属组

    1. [qtbhy@hadoop100 opt]$ sudo mkdir module 创建module文件夹
    2. [qtbhy@hadoop100 opt]$ ll
    3. 总用量 0
    4. drwxr-xr-x. 2 root root 6 4 27 12:54 module
    5. [qtbhy@hadoop100 opt]$ sudo mkdir software 创建software文件夹
    6. [qtbhy@hadoop100 opt]$ ll
    7. 总用量 0
    8. drwxr-xr-x. 2 root root 6 4 27 12:54 module
    9. drwxr-xr-x. 2 root root 6 4 27 12:55 software
    10. [qtbhy@hadoop100 opt]$ sudo chown qtbhy:qtbhy module/ software/ 修改modulesoftware的所有者和所属组
    11. [qtbhy@hadoop100 opt]$ ll
    12. 总用量 0
    13. drwxr-xr-x. 2 qtbhy qtbhy 6 4 27 12:54 module
    14. drwxr-xr-x. 2 qtbhy qtbhy 6 4 27 12:55 software
  4. 卸载虚拟机自带的JDK

    1. 查看虚拟机中的java相关文件

QQ截图20220427130842.png

  1. 卸载自带的jdk
    1. [qtbhy@hadoop100 opt]$ su root
    2. 密码:
    3. [root@hadoop100 opt]# rpm -qa | grep -i java |xargs -n1 rpm -e --nodeps
  1. 重启虚拟机

    1. [root@hadoop100 opt]# reboot

    克隆虚拟机

  2. hadoop100关机

QQ截图20220427131343.png

  1. 克隆 hadoop102 hadoop103 hadoop104
    1. 克隆

QQ截图20220427131449.png

  1. 设置虚拟机名称

QQ截图20220427131619.png

  1. 修改克隆的虚拟机IP 以hadoop102为例

    1. 开机,以root进入,右键打开终端
    2. 设置 ip

      1. [root@hadoop100 ~]# vim /etc/sysconfig/network-scripts/ifcfg-ens33

      QQ截图20220427133001.png

    3. 设置主机名

      1. [root@hadoop100 ~]# vim /etc/hostname

      QQ截图20220427133120.png

    4. 重启虚拟机

      1. [root@hadoop100 ~]# reboot
    5. 查看是否修改

QQ截图20220427134016.png

  1. ping外网 查看主机名

QQ截图20220427134205.png

  1. XShell新建会话 修改名称和用户身份验证

    hadoop102上安装jdk

  2. XShell中进入hadoop102的software目录

QQ截图20220427142804.png

  1. XShell中点Xftp按钮

QQ截图20220427142922.png

  1. 把jdk拖到hadoop102上 顺便把之后要用的Hadoop压缩包放到hadoop102上

QQ截图20220427143031.png

  1. 此时,hadoop102就有了jdk

QQ截图20220427143203.png

  1. 解压jdk压缩包到module目录下

    1. tar -zxvf jdk-8u212-linux-x64.tar.gz -C /opt/module/
  2. 进入module目录

    1. [qtbhy@hadoop102 software]$ cd ..
    2. [qtbhy@hadoop102 opt]$ cd ..
    3. [qtbhy@hadoop102 /]$ cd /opt/module/
    4. [qtbhy@hadoop102 module]$ ll
    5. 总用量 0
    6. drwxr-xr-x. 7 qtbhy qtbhy 245 4 2 2019 jdk1.8.0_212
  3. 进入jdk

    1. [qtbhy@hadoop102 module]$ cd jdk1.8.0_212
  4. 配置环境变量

    1. 查看/etc/profile.d

      1. [qtbhy@hadoop102 jdk1.8.0_212]$ cd /etc/profile.d

      里面是.sh文件
      QQ截图20220427144553.png

    2. 创建my_env.sh文件

      1. [qtbhy@hadoop102 profile.d]$ sudo vim my_env.sh
    3. jdk路径:XShell双击hadoop102标签页标签,可以在新的窗口找路径

QQ截图20220427144927.png

  1. 在文件中写入环境变量

QQ截图20220427145440.png

  1. source一下/etc/profile文件,让新的环境变量PATH生效
    1. [qtbhy@hadoop102 profile.d]$ source /etc/profile
    2. [qtbhy@hadoop102 profile.d]$ java
    QQ截图20220427145942.png

    hadoop102安装Hadoop

  1. 解压hadoop-3.1.3.tar.gz到module目录下

    1. [qtbhy@hadoop102 profile.d]$ cd /opt/software/
    2. [qtbhy@hadoop102 software]$ tar -zxvf hadoop-3.1.3.tar.gz -C /opt/module/
  2. 将Hadoop添加到环境变量

    1. [qtbhy@hadoop102 hadoop-3.1.3]$ sudo vim /etc/profile.d/my_env.sh
    2. [qtbhy@hadoop102 hadoop-3.1.3]$ pwd
    3. /opt/module/hadoop-3.1.3
  3. 打开/etc/profile.d/my_env.sh文件

    1. sudo vim /etc/profile.d/my_env.sh
  4. 在my_env.sh文件末尾添加如下内容

    1. #HADOOP_HOME
    2. export HADOOP_HOME=/opt/module/hadoop-3.1.3
    3. export PATH=$PATH:$HADOOP_HOME/bin
    4. export PATH=$PATH:$HADOOP_HOME/sbin
  5. 让修改后的文件生效

    1. [qtbhy@hadoop102 hadoop-3.1.3]$ source /etc/profile
  6. 安装成功

QQ截图20220427151928.png

  • Hadoop目录结构

QQ截图20220427152250.png

  • bin:存放对Hadoop相关服务(hdfs,yarn,mapred)进行操作的脚本
  • etc:Hadoop的配置文件目录,存放Hadoop的配置文件
  • lib:存放Hadoop的本地库(对数据进行压缩解压缩功能)
  • sbin:存放启动或停止Hadoop相关服务的脚本
  • share:存放Hadoop的依赖jar包、文档和官方案例