数据产品领域专业术语 - 《互联网术语大全》

PS: 下面仅列举了一部分,后续不断追加更新中……

BI：商务智能
ETL：数据抽取、转换和加载
ODS：操作型数据存储（Operational Data Store）是数据仓库体系结构中的一个可选部分，ODS具备数据仓库的部分特征和OLTP系统的部分特征，它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据
DW：数据仓库，英文名称为Data Warehouse，可简写为DW
DM：数据挖掘（Data Minning）
OLAP：联机分析处理，英文名称为On-Line Analysis Processing，简写为OLAP，通常在数仓中使用的处理方法
OLTP：On-Line Transaction Processing联机事务处理系统(OLTP)，通常在关系数据库中使用的处理方法
Presto：由facebook开源的分布式大数据sql查询引擎
Druid：是一个在大数据场景下的解决方案，是需要在复杂的海量数据下进行交互式实时数据展现的 BI/OLAP 工具。它有三个特点：处理的数据量规模较大；可以进行数据的实时查询展示；它的查询模式是交互式的，这也说明其查询并发能力有限。
Kylin：是一个开源的分布式分析引擎，提供Hadoop之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据。
SparkSQL：是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。
Snowflake：一种算法，目的是在分布式系统中生成全局唯一且趋势递增的ID。
SnowFlake算法的优点：
1.生成ID时不依赖于DB，完全在内存生成，高性能高可用。
2.ID呈趋势递增，后续插入索引树的时候性能较好。
SnowFlake算法的缺点：
依赖于系统时钟的一致性。如果某台机器的系统时钟回拨，有可能造成ID冲突，或者ID乱序。
Teradata
Redshift
ADB