1、可以通过spark - ui界面根据任务执行的时间-即指标分布,确定是否发生数据倾斜2、存储页面Storage,包含了缓存下来的RDD信息。3、执行器界面确实否是使用了预期的全部资源量,是否造成了浪费收集执行器进程的栈跟踪信息4、环境界面,任务的实际配置项集合追踪依赖缺失问题。