- Spark是什么?
- Spark的几种部署模式?有何特点?
- Spark和MR的区别?为何比MR快?
- Spark的工作机制是什么?
- Spark on Yarn 模式描述 Yarn执行任务的过程 container的理解?
- Spark应用程序的执行过程是什么?
- Spark技术栈的组件?组件功能?适用场景?
- Spark的Dirver/Worker等功能
- Spark数据倾斜?
- Spark内存管理?
- Spark Shuffle?
- RDD pipeline?
- Spark 分区?
- Spark SQL join?
- Spark 反压?
- SparkRDD DataSet DataFrame?
- Spark SQL实现?
- Spark Streaming?
- Spark性能调优?
- Spark数据倾斜调优 ?Spark内存调优?
- Spark内存 GC 数据结构的调优?
- Spark性能优化总结
- Spark OOM的内存问题总结
- Spark shuffle详解
- 对对对
- SPARK资源设置
- spark streaming kafka 调优