image.png

可以把流变成表 在进行操作
dataStream 主要是实时流的操作
dataSet主要是批处理 (离线)
image.png

image.png

flink spark 对比

flink毫秒级延迟。 spark 架构设计导致延迟高。几百毫秒 是一批一批数据的处理。

spark是 micro- batching 时微批处理。攒少量数据处理
flink 是流式处理。批处理的话 可以用有界api来数据

image.png

image.png