大数据平台搭建
- 1.Hadoop的安装与使用

大数据平台搭建

1.Hadoop的安装与使用

1.创建hadoop用户

sudo useradd -m hadoop -s /bin/bash    # 创建一个名叫hadoop的用户
sudo passwd hadoop    # 重新设置hadoop用户的密码
sudo adduser hadoop sudo    # 给用户hadoop增加管理员用户

2.更新apt和安装vim编辑器

sudo apt-get update    # 更新apt
sudo apt-gert install vim    # 安装vim编辑器

3.安装SSH和配置SSH无密码登录

1.安装SSH

sudo apt-get install openssh-server    # 安装ssh服务端
ssh localhost    # 登录到本机

2.配置无密码登录

exit
cd ~/.ssh/
ssh-keygen -t rsa
cat ./id_rsa.pub >> ./authorized_keys
ssh localhost     # 此时再登录本机发现就不用输入密码了

4.配置JAVA环境

sudo apt-get install default-jre default-jdk    # 安装JAVA
vim ~/.bashrc

然后在文件的第一行添加

export JAVA_HOME=/usr/lib/jvm/default-java

然后ESC,输入:wq回车。

source ~/.bashrc    # 使变量设置生效

检验设置是否正确:

echo $JAVA_HOME     # 检验变量值
java -version
$JAVA_HOME/bin/java -version  # 与直接执行java -version一样

5.安装单机Hadopp

将hadoop的安装包放在桌面上,然后执行下面的命令，将安装包解压到/usr/local目录下

sudo tar -zxf hadoop-2.7.1.tar.gz -C /usr/local    # 将安装包解压到/usr/local目录下
cd /usr/local    # 进入/usr/local目录
sudo mv ./hadoop-2.7.1/ ./hadoop    # 将目录名修改为hadoop
 sudo chown -R hadoop ./hadoop    # 修改区目录权限
cd ./hadoop    # 进入hadoop目录

然后执行

./bin/hadoop version

会输出hadoop的版本信息

Hadoop文档中还附带了一些例子供我们测试，现在可以运行Grep实例在检测一个Hadoop是否安装成功。

cd /usr/local/hadoop
mkdir input
cp ./etc/hadoop/*.xml ./input
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep ./input ./output 'dfs[a-z.]+'
cat ./output/*

到这里就安装完了单机Hadoop。