1. 安装Impyla
在 Superset 中使用 Impala 驱动,需要先安装 impyla 库,这里建议安装 impyla 最新版本,早期版本一直在 SASL 上存在问题:
$ pip install -y impyla
2. 配置Impala驱动
Impala 推荐使用 SQLAlchemy URI 方式进行连接:
impala://yumingmin:XXXXXXXXXX@1.1.1.1:21050/cszc?auth_mechanism=PLAIN
选择 Apache Impala 数据库,并填入正确的 URI,完成后可以点击测试连接,显示连接测试成功就表示正常连接 Impala 数据库。
接下来我们需要配置该数据库的其他功能,点击进阶 Tab,重点关注 SQL Lab 和 Performance 两个,其中 SQL Lab 是 SQL 编辑器,配置后之后我们就可以 Superset 上直接书写 SQL 来提数了,并不需要在 CDH 写好代码粘贴复制过来。配置 SQL Lab 时,重点关注一下允许多 Schema 元数据获取选项不要勾选,否则后台会一直去获取底层表的元数据,如果数据库中表非常多,勾选之后将会造成 Superset 系统卡顿。
另外 Performance 部分需要设置缓存时间,异步执行查询选项不要勾选,否则在 SQL Lab 中查询会比较慢。