RDD 是一个开创性的数据处理模式,其脱离了单纯的MapReduce的分布设定,整合, 处理的模式,而是采用了一个新颖的,类似一般数组或集合的处理模式,对存储在分布式存空间上的数据进行操作