课程目标:

  1. 学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程
  2. 整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动
  3. 前置知识要求
    1. 熟练掌握SQL语法
    2. 熟悉Linux命令
    3. Hadoop大数据体系有一定的了解

课程内容

  • 数仓概念
  • 项目需求及架构设计
  • 数据生成模块
    • 用户行为数据
  • 数据采集模块
    • 云服务器
    • JDK Flume
    • DataHub (框架
    • DataWorks 和 MaxCompute(组件,包括存储、计算、任务、调度
  • 用户行为数仓
    • 数仓分层概念
    • 原始数据层 ODS
    • 明细数据层 DWD
    • 服务数据层 DWS
    • 应用数据层 ADS
  • 业务数仓理论
    • 表的分类
    • 同步策略
  • 业务数仓搭建