apark - core 核心组件

1. 导读

2. spark 核心解决问题

  • 复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间。SparkCore

  • 基于历史数据的交互式查询(interactive query),通常的时间跨度在数十秒到数分钟之间。 SparkSql

  • 基于实时数据流的数据处理(streaming data processing),通常的时间跨度在数百毫秒到数秒之间。 SparkStreaming