能够借助外部存储系统将RDD的算子计算的数据中途存储在外部,从而保证安全

    此时会将mapRdd的数据存储在指定位置,会斩断RDD依赖链

    1. sc.setCheckpointDir("目录名")
    2. val mapRdd = source.map( item => (item,1))
    3. mapRdd.checkpoint()