3.1 编程模型

  • 编写Driver程序,提交到集群以调度运行
  • Driver程序中定义RDDs
  • 使用action触发RDD的计算

3.2 RDD的创建

  1. 从集合创建
    1. 使用parallelize()从集合创建
    2. 使用makeRDD()从集合创建
  2. 5.2.2 由外部存储系统的数据集创建
  3. 5.2.3 从其他RDD创建