课程目标:
- 学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程
- 整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动
- 前置知识要求
- 熟练掌握SQL语法
- 熟悉Linux命令
- 对Hadoop大数据体系有一定的了解
课程内容
- 数仓概念
- 项目需求及架构设计
- 数据生成模块
- 用户行为数据
- 数据采集模块
- 云服务器
- JDK Flume
- DataHub (框架
- DataWorks 和 MaxCompute(组件,包括存储、计算、任务、调度
- 用户行为数仓
- 数仓分层概念
- 原始数据层 ODS
- 明细数据层 DWD
- 服务数据层 DWS
- 应用数据层 ADS
- 业务数仓理论
- 表的分类
- 同步策略
- 业务数仓搭建
