公司的95-98%以上的ETL任务都是基于SQL的。

image.png
image.png

SQL on Hadoop 分类

Connector to Hadoop

使得RDBMS系统可以存取Hadoop数据,查询由RDBMS完成

SQL and Hadoop

修改现有的SQL Engine,开发工作量比较大,一般不采取。

没有强大的团队为MySQL、Oracle等改执行器基本不可能。

SQL on Hadoop

全新的SQL Engine,例如Hive、Impala、Presto等image.png