4.1 典型模型
4.1.1 ER模型
企业角度面向主题的抽象,而不是针对某个具体业务流程的实体对象关系的抽象。
- 全面了解企业业务和数据
- 实施周期非常长
-
4.1.2 维度模型
从分析决策的需求出发,重点关注用户如何更快速地完成需求分析,同时具有较好的大规模复杂查询的响应性能。星型模型,雪花模型
选择业务过程或事件的状态或业务流程
- 选择粒度
- 识别维表
- 选择事实
4.1.3 Data Vault模型
4.1.4 Anchor 模型
4.2 阿里巴巴模型实践
第一个阶段:应用驱动,建立在Oracle上,同步至ODS层,然后直接产出DSS层
第二个阶段:消除冗余,提升一致性,ER + 维度。ODL(操作数据层),BDL(基础数据层)引入ER模型加强整合,IDL(接口数据层)基于维度模型构建集市,ADL(应用数据层)完成应用的个性化和基于展现需求的数据组装。对于不太成熟,快速变化的业务构建ER模型风险非常大。
第三个阶段:分布式存储计算系统,对维度模型进行升级和扩展,构建了阿里巴巴集团的公共层模型数据架构体系和数据整合和管理体系OneData。
4.3 模型设计
- ODS(同步,结构化,累计历史,清洗)
- CDM
- DWD(明细事实数据,退化维度,面向业务过程)
- DWS(汇总数据,面向分析主题)
- DWD(明细事实数据,退化维度,面向业务过程)
- ADS(由CDM与ODS层加工生成数据产品个性化的统计指标数据)