1. Spark Shuffle

图片.png

1.1 HashShuffleManager

图片.png
图片.png

1.2 SortShuffleManager

图片.png一个并行只生成一个磁盘文件
图片.png图片.png

2. Spark 3.0新特性

2.1 Adaptive Query Execution 自适应查询(Spark SQL)

图片.png图片.png图片.png图片.png图片.png2.2 Dynamic Partition Pruning 动态分区裁剪(Spark SQL)

图片.png图片.png