2018年Tableau大会的笔记,大会现场十分精彩,笔记记录得不全,不知道后来讲师有没有将视频上传到官网。
Tableau 好像很慢?重点是知道什么叫做快,什么叫做慢。这样才知道慢在哪里。
有哪些地方可以找到慢在哪里?Tableau 有一套科学方法可以协助你找到这些东西。
什么是性能记录?
- Desktop 上的原生功能,可以查看性能记录工作簿,用于性能问题分析。
- 记录各工作簿事件所花费的时间构成:
- 连接到数据源
- 执行的 SQL 查询。
- Tableau 生成 SQL 的过程:VizQL —> Common Use 的 Tableau SQL —> 数据库真实 SQL
- 可以提取到 VizQL 或 真实 SQL 的查询语句
- 生成资料提取
- 地理编码
- 数据融合
- 计算布局
- 服务器渲染
性能记录三大区块
- 时间表
- WorkBook - Dashboard - WorkSheet - 详细的 Event
- 执行时间顺序;每个 Event 的时间排序。
- 点击某个 Event,可以查看详细的 SQL。
- 事件
查询
平行查询。同时可以并发 8 个查询。
- 预设 0.1 s 以下的查询都不显示。
Tableau Desktop 日志
- 存储日志于 Logs 子目录,位于 My Tableau Repository 目录下
Windows 路径 C:\Users\user_name\Documents\My Tableau Repository\Logs
JSON 格式,三种类型
- log 原生日志,人难以阅读
- hyperd 10.5 版本以后的名称,10.5 前叫 tableau extrat?
- tabprotosrv 最重要,是可以看到真实数据库语法,可以只看这个。
- 这个服务用于 tableau 和外界数据库通讯时,将 VizQL 或 Tableau SQL 转义为数据库 SQL。
Tableau Log Viewer
- 需要去 Github 上下载。
- A cross-platform tool for quickly glancing over Tableau log files
- 可以高亮,用于查看某一次查询的总时长。
- 优点:可以看到该条 SQL 的具体作用。
其他辅助工具
- Server 自带的
- Tableau Server Status
- Github 上有
- TabMon
- 信息更加丰富,CPU IO Network 都有
- Logshark
- 可以大批量地分析日志
- query-graphs
- 将 VizQL 通过图形化的方式来呈现
- Tabjolt
- 做压力测试
- TabMon
- Process Explorer
- 微软提供的进程细节工具
- TCPView
- 监控网络流量
性能查询调优演示
- Case I: Filter
- Case II: Type Convert
- Case III: Index
- Case IV: Partition & CCI (column based)
- Case V: Data Model
CCI: clustered columnstore index