大数据平台搭建
1.Hadoop的安装与使用
1.创建hadoop用户
sudo useradd -m hadoop -s /bin/bash # 创建一个名叫hadoop的用户
sudo passwd hadoop # 重新设置hadoop用户的密码
sudo adduser hadoop sudo # 给用户hadoop增加管理员用户
2.更新apt和安装vim编辑器
sudo apt-get update # 更新apt
sudo apt-gert install vim # 安装vim编辑器
3.安装SSH和配置SSH无密码登录
1.安装SSH
sudo apt-get install openssh-server # 安装ssh服务端
ssh localhost # 登录到本机
2.配置无密码登录
exit
cd ~/.ssh/
ssh-keygen -t rsa
cat ./id_rsa.pub >> ./authorized_keys
ssh localhost # 此时再登录本机发现就不用输入密码了
4.配置JAVA环境
sudo apt-get install default-jre default-jdk # 安装JAVA
vim ~/.bashrc
然后在文件的第一行添加
export JAVA_HOME=/usr/lib/jvm/default-java
然后ESC,输入:wq回车。
source ~/.bashrc # 使变量设置生效
检验设置是否正确:
echo $JAVA_HOME # 检验变量值
java -version
$JAVA_HOME/bin/java -version # 与直接执行java -version一样
5.安装单机Hadopp
将hadoop的安装包放在桌面上,然后执行下面的命令,将安装包解压到/usr/local目录下
sudo tar -zxf hadoop-2.7.1.tar.gz -C /usr/local # 将安装包解压到/usr/local目录下
cd /usr/local # 进入/usr/local目录
sudo mv ./hadoop-2.7.1/ ./hadoop # 将目录名修改为hadoop
sudo chown -R hadoop ./hadoop # 修改区目录权限
cd ./hadoop # 进入hadoop目录
然后执行
./bin/hadoop version
会输出hadoop的版本信息
Hadoop文档中还附带了一些例子供我们测试,现在可以运行Grep实例在检测一个Hadoop是否安装成功。
cd /usr/local/hadoop
mkdir input
cp ./etc/hadoop/*.xml ./input
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar grep ./input ./output 'dfs[a-z.]+'
cat ./output/*
到这里就安装完了单机Hadoop。