常用转换操作

对一个数据为{1,2,3,3}的RDD进行基本的RDD转化操作

函数	操作	例子	结果
map	将函数应用于RDD中的每个元素，返回值构成新的RDD	rdd.map(x => x+1)	{2,3,4,4}
flatmap	将函数应用于RDD中的每个元素，返回迭代器的所有元素构成新的RDD。通常用来切分单词	rdd.flatmap(x = x.to(3))	{1,2,3,2,3,3,3}
filter	将返回一个由通过传给filter的函数组成的RDD	rdd.filter(x => x != 1)	{2,3,3}
distinct	去重	rdd.distinct()	{1,2,3}
sample（withReplacement,fraction,[seed])	对RDD采样，以及是否替换	rdd.sample(false,0.5)	非确定的

分别为{1,2,3}和{3,4,5}的RDD进行针对两个 RDD的转换操作

大数据日记