什么是数据仓库?
数据仓库(Data Warehouse)是由 比尔·恩门 在1991年提出的。数据仓库是一个过程,也是一个环境,而不是一个项目或者产品。数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。其提供用于用于决策支持的当前和历史数据。
数据仓库也可以说是一种面向商务智能(BI)活动(尤其是分析)的数据管理系统,通常涉及大量的历史数据,适用于查询和分析。
数据库与数据仓库对比
- 数据库是面向事务的设计,数据仓库是面向主题设计的。
- 数据库一般服务于业务系统的,数据仓库一般是服务于分析系统的。
- 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。
- 数据库设计是尽量避免冗余,数据仓库在设计是有意引入冗余。
- 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。
- 数据库一般会对数据进行增删改查,数据仓库一般只对进行增和查,基本不会修改数据。
附参考资料:
数据库和数据仓库的区别