症状: Spark任务一直提交失败, 没有任务日志排查过程: 怀疑是数据倾斜导致的超大任务超时Failed. 手动测试跑数, 检查计算逻辑, 查看Spark Web UI, 检查Task执行情况并调大内存大小排查后否定 看一眼GC日志 原因: 提交集群为天津集群, 计算集群是南京集群, 遇到了南北调度问题解决方案: 更改提交入口