有shuffle操作:会在多个节点之间进行数据拷贝,会有IO

    1.先进行分区内的map操作,分区内先排序
    2.最后在分区间进行汇总排序
    image.png

    image.pngimage.png