作用:求并集. 对源 RDD 和参数 RDD 求并集后返回一个新的 RDD
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object test {
def main(args: Array[String]): Unit = {
val conf: SparkConf = new SparkConf().setAppName("SparkCoreTest").setMaster("local[*]")
val sc: SparkContext = new SparkContext(conf)
val rdd1: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4), 2)
val rdd2: RDD[Int] = sc.makeRDD(List(4, 5, 6, 7), 3)
//合集
val newRDD: RDD[Int] = rdd1.union(rdd2)
println(newRDD.collect().mkString(",")) //输出: 1,2,3,4,4,5,6,7
sc.stop()
}
}