一 缩减分区

  1. RDDVal.coalesce(2)

1.没有shuffle

直接把分区中的数据放入到其中一个分区中
分区数物理上不变,只是并行度减少了
image.png

2.shuffle

打乱所有分区内的数据,重新组成
image.png

二 扩大分区

会有shuffle操作

因为会打乱各个分区内的数据

  1. RDDVal.coalesce(8,shuffle = true)