2018年Tableau大会的笔记,大会现场十分精彩,笔记记录得不全,不知道后来讲师有没有将视频上传到官网。

    Tableau 好像很慢?重点是知道什么叫做快,什么叫做慢。这样才知道慢在哪里。
    有哪些地方可以找到慢在哪里?Tableau 有一套科学方法可以协助你找到这些东西。

    什么是性能记录?

    • Desktop 上的原生功能,可以查看性能记录工作簿,用于性能问题分析。
    • 记录各工作簿事件所花费的时间构成:
      • 连接到数据源
      • 执行的 SQL 查询。
        • Tableau 生成 SQL 的过程:VizQL —> Common Use 的 Tableau SQL —> 数据库真实 SQL
        • 可以提取到 VizQL 或 真实 SQL 的查询语句
      • 生成资料提取
      • 地理编码
      • 数据融合
      • 计算布局
      • 服务器渲染

    image.png

    性能记录三大区块

    • 时间表
      • WorkBook - Dashboard - WorkSheet - 详细的 Event
      • 执行时间顺序;每个 Event 的时间排序。
      • 点击某个 Event,可以查看详细的 SQL。
    • 事件
    • 查询

    • 平行查询。同时可以并发 8 个查询。

    • 预设 0.1 s 以下的查询都不显示。

    image.png

    Tableau Desktop 日志

    • 存储日志于 Logs 子目录,位于 My Tableau Repository 目录下
    • Windows 路径 C:\Users\user_name\Documents\My Tableau Repository\Logs

    • JSON 格式,三种类型

      • log 原生日志,人难以阅读
      • hyperd 10.5 版本以后的名称,10.5 前叫 tableau extrat?
      • tabprotosrv 最重要,是可以看到真实数据库语法,可以只看这个。
        • 这个服务用于 tableau 和外界数据库通讯时,将 VizQL 或 Tableau SQL 转义为数据库 SQL。

    Tableau Log Viewer

    • 需要去 Github 上下载。
    • A cross-platform tool for quickly glancing over Tableau log files
    • 可以高亮,用于查看某一次查询的总时长。
    • 优点:可以看到该条 SQL 的具体作用。

    其他辅助工具

    • Server 自带的
      • Tableau Server Status
    • Github 上有
      • TabMon
        • 信息更加丰富,CPU IO Network 都有
      • Logshark
        • 可以大批量地分析日志
      • query-graphs
        • 将 VizQL 通过图形化的方式来呈现
      • Tabjolt
        • 做压力测试
    • Process Explorer
      • 微软提供的进程细节工具
    • TCPView
      • 监控网络流量

    性能查询调优演示

    • Case I: Filter
    • Case II: Type Convert
    • Case III: Index
    • Case IV: Partition & CCI (column based)
    • Case V: Data Model

    CCI: clustered columnstore index