学习参考基本概念RDD、DataFrame和DataSet的区别saveAsTextFile 生成多个文件本地测试时JVM申请的memory不足解决办法spark-submit 指令详解四种、常见运行模式Spark rest api 决策方案azkaban 和oozie几种运行模式,运行模版spark 编译成 cdh 版本spark 调优spark 执行流程