联邦查询&交互式分析

在编写报告、执行分析和生成预测模型之前,需要快速交互通信来分析和理解数据。Starburst可以比其它解决方案更好地满足这一诉求。
Starburst将现有的数据源与新的数据源(无论其位于何处)连接在一起,只要简单地扩展Starburst,就可以高效访问数据,即使这些数据并非全部位于原始数据源中。数据可以从单个源快速查询,也可以通过联邦查询进行组合,让来自不同来源或以不同格式存储的数据可以像在同一数据库中一样进行连接和操作,在5到10秒或更短的时间内返回结果。
使用Starburst,您可以选择喜爱的SQL或BI工具。比如使用您最喜欢的客户端(如SQuirreL、Toad、PowerBI)分析数据。
image.png

商业智能仪表盘&报表

商业智能仪表板和报告要求快速访问单个源或联合源中的数据。业务智能分析师、风险和监管团队以及该组中的其他用户需要快速访问各种报告功能需要的数据。这块除了使用SQL查询外,还可以在Tableau、Qlik、Looker、powerbi、ThoughtSpot和其它BI工具中构建饼图和仪表盘。
但在以前支持的BI工具中,很难通过相同的连接查询不同的数据源,而需要借助于创建小型数据集市。Starburst支持了这一特性,并允许使用自己喜欢的工具进行查询,同时极大地扩展了数据访问能力。
image.png

数据湖

Starburst提供类似数据仓库的功能,如开放数据格式的事务和物化视图。它是具有数据仓库功能的更快的数据湖。无论是HDFS、S3、ADL、GCS还是S3兼容的对象存储,都能提供高度并行和高性能的分布式查询引擎。
之前在湖中更新数据会带来法规遵从性和数据质量方面的挑战,因为它们缺乏写入功能。但Delta Lake通过提供目标写入解决了这一问题。Starburst支持Delta Lake上的写入操作,可以直接在湖中修改数据,最大限度地提高在数据湖中的投资回报率。
image.png

全球安全和访问控制

Starburst Enterpris具备细粒度的权限控制和安全管控:

  • 权限控制
    ApacheRanger提供了基于角色的访问控制,除了列级屏蔽和行级过滤之外,还提供了模式/表/列访问控制。其他仅适用于Starburst的功能包括Okta身份验证。
  • 全球安全
    Starburst将这些安全控制扩展到所有企业数据源。集中权限和访问策略的能力会带来更强、更易于管理的安全性。
  • AuthN&AuthZ
    凭证保存在源系统中,策略只能通过Ranger或Sentry UI更改。
  • 查询审核日志
    Starburst保留审核日志,详细记录提交查询的时间、用户等。
  • Starburst密钥
    Starburst不维护用户名和密码等凭据,而是在运行时安全插入。
  • 加密
    Starburst支持集群内数据流和静态数据的加密。

image.png