RDD是一个不可变的分布式对象集合。每个RDD都被分为多个分区,这些分区运行在集群中的不同节点上。

    RDD支持两种类型的操作,转换操作(transformation)和行动操作(action)。

    对于RDD的操作java和scala有很大不同。