1. 平台概述
1.1 cloudera架构
Agent:安装在每一台主机上,负责进程的启动和停止、配置解压、触发安装,并监控主机。
Management Service:由一组服务组成,负责平台的监控、告警和分析报告功能。
Database:负责存储配置和监控信息。
Cloudera Repository:CDH软件版本仓库。
* Clients:Clients是与服务交互的接口,包括Web-based UI或API。 Cloudera Manager Server与Cloudera Manager Agent之间通过心跳(Heartbeating)进行通信,Agent 每15秒发送一次心跳给Server,以汇报自己的活动。Server 也通过心跳响应Agent的活动。15秒的频率可以调整。
1.2 CDH概述
2 大数据集群安装及角色分配
以下按照最小规模集群进行角色分配,大规模集群根据情况增加响应的角色实例节点。 在服务器上分配角色时,为了避免接入层交换机的故障导致集群的不可用,需要将一些高可用的角色部署到不同的接入层交换机下。(1)关键组件的角色信息
Cloudera的软件体系结构包含如下模块:系统部署和管理,数据存储,资源管理,处理引擎,工具库以及访问接口。关键组件的角色信息如下:
Cloudera Manager选用1个管理节点安装,Cloudera Manager就安装Cloudera Manager、Cloudera Management Service和MySQL数据库。
(3)主节点安装
至少三个主节点,主节点上安装CDH服务的管理节点以及HA组件,在必要的情况下,三个主节点放置在不同的机柜上。可以如下方式部署: