1、可以通过spark - ui界面根据任务执行的时间-即指标分布,确定是否发生数据倾斜
    2、存储页面Storage,包含了缓存下来的RDD信息。
    3、执行器界面确实否是使用了预期的全部资源量,是否造成了浪费
    收集执行器进程的栈跟踪信息
    4、环境界面,任务的实际配置项集合
    追踪依赖缺失问题。