apark - core 核心组件1. 导读2. spark 核心解决问题apark - core 核心组件1. 导读 spark 生态以及构架 spark 源码 spark 运行模式 spark 计算模型 2. spark 核心解决问题 复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间。SparkCore 基于历史数据的交互式查询(interactive query),通常的时间跨度在数十秒到数分钟之间。 SparkSql 基于实时数据流的数据处理(streaming data processing),通常的时间跨度在数百毫秒到数秒之间。 SparkStreaming