Flink简介
Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算。
为什么选择Flink
- 流数据更真实地反映了我们生活方式
- 传统的数据架构是基于有限数据集的
我们的目标
那些行业需要处理流数据
电商和市场营销
数据报表 广告投放 业务流程需要
物联网
传感器实时数据采集和显示 实时报警 交通运输业电信业
基站流量调配
- 银行和金融业
实时结算和通知推送 实时检测异常行为
有状态的流式处理

Flink的主要特点
Flink的其他特点
- 支持事件时间(event-time)和 处理时间(processing-time)语义
- 精确一次(exactly-once)的状态一致性保证
- 低延迟,每秒处理数百万个事件,毫秒级延迟
- 与众多常用存储系统的连接
- 高可用,动态扩展,实现7*24小时全天候运行
Flink vs Spark Streaming

Flink运行时的组件

任务提交流程
任务提交流程(YARN)
任务调度原理





