控制延迟

默认情况下,流中的元素不会一个一个的在网络中传输,而是缓存起来,缓存的大小可以在flinkl的配置文件 ExecutionEnvironment 在某个算子上进行配置 默认是i100ms

  1. 好处 提高吞吐
  2. 坏处 增加了延迟
    1. 可以设置serBufferTimeout(-1)移除timeout机制,缓存中的数据一满就会发送
    2. 可以超时设置为接近0的数 不要设置为0,带来一些性能的损耗

SourceFunction分为并行function以及非并行function

  • RichParallelSourceFunction
  • SourceFunction

FlinkKafkaConsumerBase 继承 RichParallelSourceFunction