- Spark是什么
- Spark有哪些部署模式?都有什么特点?
- Spark技术栈有哪些组件?组件功能特点?
- Spark中的Worker/Dirver功能是什么?
- Spark和MR的区别?为什么Spark比MR要快?
- 简单说一下RDD
- Spark的工作机制是什么样的?
- RDD的宽依赖和窄依赖是什么?
- RDD的血缘机制?
- RDD的cache和persist的区别?
- Spark常见端口?
- Spark的调度模式?
- Spark共享变量?
- Spark task job stage partition之间联系和区别?
- Spark常用算子 转换算子和动作算子?
- Spark Shuffle?
- Spark 分区?
- Spark应用执行过程?
- Spark 资源分配 粗粒度和细粒度?