在计算机领域,数据仓库(英语:data warehouse,也称为企业数据仓库)是用于报告和数据分析的系统,被认为是商业智能的核心组件。数据仓库是来自一个或多个不同源集成数据的中央存储库。数据仓库将当前和历史数据存储在一起,用于为整个企业的员工创建分析报告。
存储在仓库中的数据从运行系统(例如营销或销售)上传。这些数据可能会通过先存入ODS层,通过额外的操作如数据清理(提取、转换、加载(ETL)),以确保数据质量,然后才能在数据仓库中用于报告。

简易解释

数据仓库是一种信息系统的资料存储理论,此理论强调利用某些特殊资料存储方式,让所包含的资料,有利于分析处理,以产生有价值的信息并依此作决策。通过对数据仓库中数据的分析,帮助企业,改进业务流程、控制成本、提高产品质量等。数仓的目的是为数据最终的使用地做好准备。这些准备包括对数据的:清洗,转义,分类,重组,合并,拆分,统计等等。

数仓概念 - 图1