最近使用 Superset 制作了一些图表,遇到一个性能问题是每次刷新浏览器时,都需要等待很久才能将图表加载出来,原因在于图表所使用的数据集是实时从 Impala 数据库中提取出来的,这个取数的时间其实就很耗时了。

预期的效果:第一次加载后将数据缓存下来,后续打开看板或图表可以秒开,其他人打开时也可以秒开。
实现方式:耗时最多的时间是从数据中提数这一步骤,将图表所使用的数据集缓存到数据库中,可以有效地解决这个问题。

1. 数据集缓存

编辑数据集,在设置中配置缓存时间为 36000 秒,也就是 10 个小时。这一步完成之后,并不能实现我们想要的效果,因为缓存数据库还没有配置。
image.png

2. 配置Redis缓存

首选确保 Redis Server 服务已经开启了,然后在项目下 superset_config.py 文件配置以下参数:

  1. DATA_CACHE_CONFIG: CacheConfig = {
  2. 'CACHE_TYPE': 'redis',
  3. 'CACHE_DEFAULT_TIMEOUT': 60 * 60 * 24, # 1 day default (in secs)
  4. 'CACHE_KEY_PREFIX': 'superset_results',
  5. 'CACHE_REDIS_URL': 'redis://127.0.0.1:6379/0',
  6. }

配置好之后,重启你的 Superset 就好了,再次查看图表,你会发现就效果如预期那样了。