RDD、dataframe、datasetStreaming乱七八糟DStream的创建、转换UDF、UDAF、UDTFDS的创建、保存、转换DF的创建、保存、转换RDD累加器、广播变量RDD算子-keyvalue型数据RDD算子-value型数据RDD分区RDD序列化RDD的创建、保存、转换spark core优化joinshufflesubmit六种运行模式启动步骤端口pyspark存储计算分离问题记录spark streaming优化spark sql优化