- 中间结果放内存 + DAG(有向无环图) 所以快
创建RDD
- 集合创建
- 文件创建
-
Transformation & Action
两种RDD操作
- Transformation的特性:lazy
- Action触发之前所有Transformation执行
常用Transformation
Accumulator累加变量
持久化
cache() = persist(MEMORY_ONLY)
数据放入内存中缓存
Broadcast Variable广播变量
- 每个节点拷贝一份
- 广播变量只读
两种RDD操作
让时间为你证明