状态
状态算子
sparkStream的状态存储在是ck
UpStateByKeyTest
[K-V]类型
需要将之前状态的数据进行保存,需要设置ck目录(checkpoint),一般是hdfs路径,测试的话可以使用本地目录
如果当前批次为第一批次,那么option就为None()
开窗算子
reduceByKeyAndWindow
只要每设置ck都是无状态算子
所有窗口运算,都可以先开窗再运算
以上写法等价于:
所以,没有提供类似于reduceByKeyAndWindow方法的算子就自己先windows