CM资源规划
组件 | cfp-acrm-cdh-1 | cfp-acrm-cdh-2 | cfp-acrm-cdh-3 |
---|---|---|---|
ZooKeeper | QuorumPeerMain | QuorumPeerMain | QuorumPeerMain |
HDFS | NameNode/DataNode | DataNode | SecondaryNameNode/DataNode |
YARN | NodeManager/JobHistoryServer | ResourceManager/NodeManager | NodeManager |
Hadoop安装配置
Φ 基本操作
基本操作包括登录CM、接受条款和协议、选择版本(免费)等,过程略。
Φ 指定主机
指定集群节点,注意检查IP地址是否正常,如果显示127.0.0.1则需要修改/etc/hosts文件,注释# 127.0.1.1 ${HOST_NAME}之后分发所有异常节点并重启CM Server、CM Agent。
Φ 选择CDH版本
安装正常的情况下,界面会自动加载当前的CDH版本,建议当前安装的CM安装包版本。如果没有显示相关版本信息,则需要重新检查安装过程是否存在遗漏或者忽略的细节,解决之后才能继续之后的安装。
Φ 自定义安装
“集群设置”标签页中,选择“自定义服务”,勾选“HDFS”、“YARN”和“ZooKeeper”。
Φ 分配节点
根据CM资源规划继续节点分配,避免某一个节点压力过大,尽量均匀分布,如:Hadoop的NameNode、SecondaryNameNode、ResourceManager避免在同一个节点。ZooKeeper选择搭建高可用基数节点集群。
Φ 集群设置
配置修改
Φ 关闭HDFS中的权限检查
进入菜单:“集群”/“cluster 1”/“HDFS”/“配置”,之后从搜索栏检索出“检查 HDFS 权限”,去掉勾选。
Φ 配置Hadoop支持LZO
进入菜单:“主机”/“Parcel”/“配置”/“远程Parcel存储库URL”,点击最后一栏的加号,增加一栏,输入:http://archive.cloudera.com/gplextras/parcels/latest/,之后点击保存更改。返回Parcel列表,可以看到多出了“HADOOP_LZO”,选择“下载”,下载完成后选择“分配”,分配完成后选择“激活”。
安装完LZO后,打开HDFS配置(“集群”/“cluster 1”/“HDFS”/“配置”),找到“压缩编码解码器”一栏,点击加号,添加“com.hadoop.compression.lzo.LzopCodec”后保存更改。
Φ 配置YARN支持LZO
打开YARN配置(“集群”/“cluster 1”/“YARN(MR2 Included)”/“配置”),找到“MR 应用程序 Classpath”,添加“/opt/cloudera/parcels/HADOOP_LZO/lib/hadoop/lib/hadoop-lzo-cdh4-0.4.15-gplextras.jar”后保存更改。
Φ 配置YARN内存限制
打开YARN配置(“集群”/“cluster 1”/“YARN(MR2 Included)”/“配置”),找到“yarn.nodemanager.resource.memory-mb”和“yarn.scheduler.maximum-allocation-mb”,配置为4G后保存更改。
Φ 配置生效
进入菜单:“集群”/“cluster 1”,更新过期配置(点击图标),重启进程。
验证
NameNode WebUI:http://cfp-acrm-cdh-1:50070
ResourceManager WebUI:http://cfp-acrm-cdh-2:8088
HistoryServer WebUI:http://cfp-acrm-cdh-1:19888
CM TCP端口清单:https://www.yuque.com/polaris-docs/bigdata/cdh