控制延迟
默认情况下,流中的元素不会一个一个的在网络中传输,而是缓存起来,缓存的大小可以在flinkl的配置文件 ExecutionEnvironment 在某个算子上进行配置 默认是i100ms
- 好处 提高吞吐
- 坏处 增加了延迟
- 可以设置serBufferTimeout(-1)移除timeout机制,缓存中的数据一满就会发送
- 可以超时设置为接近0的数 不要设置为0,带来一些性能的损耗
SourceFunction分为并行function以及非并行function
- RichParallelSourceFunction
- SourceFunction
FlinkKafkaConsumerBase 继承 RichParallelSourceFunction