l 批处理可以看做是有限的流处理。即数据是有尽头的。
l 批处理相当于定义一个全局窗口,将所有数据都认为是一个窗口的内容。
// 全局窗口的使用
val counts = visits
.keyBy(“region”)
.window(GlobalWindows.create)
.trigger(EndOfTimeTrigger.create)
.sum(“visits”)
l Flink也有专门的DataSet API来处理批处理。
// DataSet API
val counts = visits
.groupBy(“region”)
.sum(“visits”)
l 流处理和批处理的API用的都是同一套底层引擎。