作用: 计算交集. 对源 RDD 和参数 RDD 求交集后返回一个新的 RDD

    1. import org.apache.spark.rdd.RDD
    2. import org.apache.spark.{SparkConf, SparkContext}
    3. object test {
    4. def main(args: Array[String]): Unit = {
    5. val conf: SparkConf = new SparkConf().setAppName("SparkCoreTest").setMaster("local[*]")
    6. val sc: SparkContext = new SparkContext(conf)
    7. val rdd1: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4), 2)
    8. val rdd2: RDD[Int] = sc.makeRDD(List(4, 5, 6, 7), 3)
    9. //交集
    10. val newRDD2: RDD[Int] = rdd1.intersection(rdd2)
    11. println(newRDD2.collect().mkString(",")) //输出: 4
    12. sc.stop()
    13. }
    14. }