是关系型数据库之父E.F.Codd提出的。
OLAP不需要那么强事务的能力。
OLAP的相关概念
维 dim
维的层次
维的成员
多维数组
度量
OLAP的特点
快
可分析
多维性
信息性
OLAP的数据结构
Cube
数据超立方体,也称为数据立方体,指用三维或更多的维数来描述一个对象,每个维彼此垂直,数据的测量值发生在维的交叉点上,数据空间的各个部分都有相同的维属性。
特点
主要操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill acros、drill through等。
OLAP的目标是满足多维度数据查询和报表需求,核心点是 “多维度”。
在很大程度上,能够充分降低数据分析的使用门槛,大大降低数据挖掘的成本。
即方便数据分析师挖掘数据,又能让不熟悉 SQL 语言的产品、运营等业务同学通过简单的鼠标拖曳完成数据分析。
对比传统
传统写脚本
明确数据需求和统计口径;
锁定统计所需要的数据表和字段;
编写脚本,并测试语法正确无误;
运行脚本,等待数据结果;
任务执行结束,导出数据结果;
将结果汇总整理后发送需求方。
OLAP处理数据
确定数据需求和统计维度;
确认 OLAP 系统统计维度完整;
鼠标拖曳维度,像 Excel 透视表一样,瞬间得到计算结果;
下载数据结果,直接发送给业务方。
OLAP 之所以能够快速处理数据,是因为在搭建 OLAP 时会提前定义好常用的分析维度,预计算各维度的统计值,使得数据分析师可以在进行“上卷下钻”时能够将数据加载到内存中快速汇聚统计。
OLAP在大数据体系的位置
由于OLAP能力越来越强,由只存结果数据演变为也存明细数据。