docker运行容器 - docker 搭建hadoop集群 - 《linux》

创建虚拟网络
拉取centos镜像
创建一个centos容器
安装 jdk1.8、Scala
配置SSH
安装Hadoop
配置hadoop
创建3个一样的容器
制作镜像
- 在h01中启动hadoop

创建虚拟网络

docker network create —driver=bridge hadoop

拉取centos镜像

docker pull centos

创建一个centos容器

docker run -itd --privileged --name Centos8 centos /usr/sbin/init
docker exec -it Centos8 /bin/bash

安装 jdk1.8、Scala

yum install -y vim bash-completion net-tools wget // 安装小工具
cd /etc/yum.repos.d/
mkdir bak
mv * bak/
wget https://mirrors.aliyun.com/repo/Centos-8.repo
yum clean all
yum makecache
yum install java-1.8.0-openjdk* -y
java -version
yum install scale -y
scale //测试

配置SSH

集群间需要使用ssh互相通信

yum install openssh-server openssh-clients -y //安装ssh
cd
ssh-keygen -t rsa -P "" //生成密钥，免密登录
cat .ssh/id_rsa.pub >> .ssh/authorized_keys
systemctl start sshd
ssh 127.0.0.1 //测试免密登录
exit // 记得退出
vim ~/.bashrc //配置ssh服务开机自启动
// 在文件最下面添加一行
systemctl start sshd

安装Hadoop

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
tar -zxvf hadoop-3.2.1.tar.gz -C /usr/local/
cd /usr/local/
mv hadoop-3.2.1 hadoop

配置hadoop

编辑/etc/profile，在文件最后加入以下内容

JAVA_HOME 为 JDK 安装路径，用 update-alternatives —config java 可查看

#java
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.272.b10-1.el8_2.x86_64
export JRE_HOME=${JAVA_HOME}/jre    
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib    
export PATH=${JAVA_HOME}/bin:$PATH
#hadoop
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_COMMON_HOME=$HADOOP_HOME 
export HADOOP_HDFS_HOME=$HADOOP_HOME 
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_YARN_HOME=$HADOOP_HOME 
export HADOOP_INSTALL=$HADOOP_HOME 
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native 
export HADOOP_CONF_DIR=$HADOOP_HOME 
export HADOOP_LIBEXEC_DIR=$HADOOP_HOME/libexec 
export JAVA_LIBRARY_PATH=$HADOOP_HOME/lib/native:$JAVA_LIBRARY_PATH
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HDFS_DATANODE_USER=root
export HDFS_DATANODE_SECURE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export HDFS_NAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

生效 source /etc/profile

修改 hadoop-env.sh
/usr/local/hadoop/etc/hadoop/hadoop-env.sh

在文件最后追加以下内容

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.272.b10-1.el8_2.x86_64
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

修改 core-site.xml

/usr/local/hadoop/etc/hadoop/core-site.xml

将文件内容修改为以下内容，其中h01为主机名字，可在/etc/hosts中添加

<configuration>
  <property>
      <name>fs.default.name</name>
      <value>hdfs://h01:9000</value>
  </property>
  <property>
      <name>hadoop.tmp.dir</name>
      <value>/home/hadoop3/hadoop/tmp</value>
  </property>
</configuration>

修改 hdfs-site.xml

/usr/local/hadoop/etc/hadoop/hdfs-site.xml

<configuration>
  <property>
      <name>dfs.replication</name>
      <value>2</value>
  </property>
  <property>
      <name>dfs.namenode.name.dir</name>
      <value>/home/hadoop3/hadoop/hdfs/name</value>
  </property>
  <property>
      <name>dfs.namenode.data.dir</name>
      <value>/home/hadoop3/hadoop/hdfs/data</value>
  </property>
</configuration>

修改 mapred-site.xml

/usr/local/hadoop/etc/hadoop/mapred-site.xml

<configuration>
  <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
  </property>
  <property>
      <name>mapreduce.application.classpath</name>
      <value>
          /usr/local/hadoop/etc/hadoop,
          /usr/local/hadoop/share/hadoop/common/*,
          /usr/local/hadoop/share/hadoop/common/lib/*,
          /usr/local/hadoop/share/hadoop/hdfs/*,
          /usr/local/hadoop/share/hadoop/hdfs/lib/*,
          /usr/local/hadoop/share/hadoop/mapreduce/*,
          /usr/local/hadoop/share/hadoop/mapreduce/lib/*,
          /usr/local/hadoop/share/hadoop/yarn/*,
          /usr/local/hadoop/share/hadoop/yarn/lib/*
      </value>
  </property>
</configuration>

修改 mapred-site.xml

/usr/local/hadoop/etc/hadoop/yarn-site.xml

<configuration>
  <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>h01</value>
  </property>
  <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
  </property>
</configuration>

修改hadoop/workers

/usr/local/hadoop/etc/hadoop/workers
用于群起脚本
```
h01
h02
h03
```
创建3个一样的容器
```bash docker ps -a
制作镜像
docker commit -m “Alitahadoop” -a “Alita” 73a701cae68b alitahadoop docker images

//启动的是 h01 是做 master 节点的，所以暴露了端口，以供访问 web 页面 docker run -itd —privileged —network hadoop -h “h01” —name “h01” -p 9870:9870 -p 8088:8088 alitahadoop /usr/sbin/init docker run -itd —privileged —network hadoop -h “h02” —name “h02” alitahadoop /usr/sbin/init docker run -itd —privileged —network hadoop -h “h03” —name “h03” alitahadoop /usr/sbin/init

docker start h01 h02 h03

<a name="lHL9C"></a>
### 配置各个容器对应的/etc/hosts文件
```bash
# 查看ip:
docker inspect h01
172.18.0.2    h01
172.18.0.3    h02
172.18.0.4    h03

在h01中启动hadoop

docker exec -it h01 /bin/bash
cd /usr/local/hadoop/bin
hdfs namenode -format //先进行格式化操作
cd /usr/local/hadoop/sbin/ //进入 hadoop 的 sbin 目录
./start-all.sh //启动
//关闭集群执行脚本 ./stop-all.sh
cd /usr/local/hadoop/bin
./hadoop dfsadmin -report /查看分布式文件系统的状态

http://localhost:8088

docker 搭建hadoop集群

创建虚拟网络

拉取centos镜像

创建一个centos容器

安装 jdk1.8、Scala

配置SSH

安装Hadoop

配置hadoop

修改 hadoop-env.sh

修改 core-site.xml

修改 hdfs-site.xml

修改 mapred-site.xml

修改 mapred-site.xml

修改hadoop/workers

创建3个一样的容器

制作镜像

在h01中启动hadoop