• spark 基于内存的
    • spark 运行速度比mr块的两个原因
    • 可以通过多个语言
    • spark core 底层 前三次课
    • 分布式的运行框架
    • 兼容性:可以运行在hadoop上
    • 数据源
    • RDD核心知识点


    zoop
    hoodoop
    sacala

    预习RDD、以及70-80个算子挨个执行看看