数据仓库
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
数据集市
数据集市(Data Mart) ,也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。
数据湖
数据湖或hub的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS廉价存储硬件之上的。但数据量越大,越需要各种不同种类的存储。最终,所有的企业数据都可以被认为是大数据,但并不是所有的企业数据都是适合存放在廉价的HDFS集群之上的。常见的数据湖架构有:Delta Lake(Databricks)、Iceberg(Netflix)、Hudi(Uber)。
湖仓一体
湖仓一体(Data Lakehouse,Databricks)是数据管理领域中的一种新架构范例,结合了Data Warehouse和Data Lakes的最佳特性。一旦将数据加载到数据湖中,就无需将数据加载到仓库中进行其他分析或商业智能。您可以直接查询便宜但高度可靠的存储(通常称为“对象存储”)中的数据,从而减少了数据管道上的操作开销。
数据中台
数据中台简单来说就是提取各个业务的数据,统一标准和口径,通过数据计算和加工为用户提供数据服务。数据中台是一套可持续“让企业的数据用起来”的机制,一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建一套持续不断把数据变成资产并服务于业务的机制。数据中台需要具备数据汇聚整合、数据提纯加工、数据服务可视化、数据价值变现4个核心能力,让企业员工、客户、伙伴能够方便地应用数据。