PS: 下面仅列举了一部分,后续不断追加更新中……

    BI:商务智能
    ETL:数据抽取、转换和加载
    ODS:操作型数据存储(Operational Data Store)是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据
    DW:数据仓库,英文名称为Data Warehouse,可简写为DW
    DM:数据挖掘(Data Minning)
    OLAP:联机分析处理,英文名称为On-Line Analysis Processing,简写为OLAP,通常在数仓中使用的处理方法
    OLTP:On-Line Transaction Processing联机事务处理系统(OLTP),通常在关系数据库中使用的处理方法
    Presto:由facebook开源的分布式大数据sql查询引擎
    Druid:是一个在大数据场景下的解决方案,是需要在复杂的海量数据下进行交互式实时数据展现的 BI/OLAP 工具。它有三个特点:处理的数据量规模较大;可以进行数据的实时查询展示;它的查询模式是交互式的,这也说明其查询并发能力有限。
    Kylin:是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据。
    SparkSQL:是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。
    Snowflake:一种算法,目的是在分布式系统中生成全局唯一且趋势递增的ID。
    SnowFlake算法的优点:
    1.生成ID时不依赖于DB,完全在内存生成,高性能高可用。
    2.ID呈趋势递增,后续插入索引树的时候性能较好。
    SnowFlake算法的缺点:
    依赖于系统时钟的一致性。如果某台机器的系统时钟回拨,有可能造成ID冲突,或者ID乱序。
    Teradata
    Redshift
    ADB