1. Spark是什么
    2. Spark有哪些部署模式?都有什么特点?
    3. Spark技术栈有哪些组件?组件功能特点?
    4. Spark中的Worker/Dirver功能是什么?
    5. Spark和MR的区别?为什么Spark比MR要快?
    6. 简单说一下RDD
    7. Spark的工作机制是什么样的?
    8. RDD的宽依赖和窄依赖是什么?
    9. RDD的血缘机制?
    10. RDD的cache和persist的区别?
    11. Spark常见端口?
    12. Spark的调度模式?
    13. Spark共享变量?
    14. Spark task job stage partition之间联系和区别?
    15. Spark常用算子 转换算子和动作算子?
    16. Spark Shuffle?
    17. Spark 分区?
    18. Spark应用执行过程?
    19. Spark 资源分配 粗粒度和细粒度?