RDD是一个不可变的分布式对象集合。每个RDD都被分为多个分区,这些分区运行在集群中的不同节点上。 RDD支持两种类型的操作,转换操作(transformation)和行动操作(action)。 对于RDD的操作java和scala有很大不同。