- 本篇更偏重业务相关的学习,代码层面设涉及不多
离线计算
-
特点
数据量巨大,保存时间长
- 在大量数据上进行复杂的批量运算
- 数据在计算之前已经完全到位,不会发生变化
-
实时计算
-
场景
电商成交量实时大屏
- 港口流量实时分析
-
能解决的问题
市面上的流计算平台做到了什么
我司vs竞品
采集数据的方式
mysql 下的binlog 与 间隔轮训
定制化flinksql的在线ide
- 运维 metrics 图形是否展示正常
- 实时采集到的数据准确度,有无丢失,是否按照逻辑完成提取跟写入
- 用户自定义函数 jar包的导入,计算任务导出
在线问题的复现,修复之后的确认,问题log追溯方式方法,追溯思路
数据中台做了什么事情?
-
Flink学习前置知识了解
数据集合类型
无穷数据集: 无穷的持续继承的数据集合 实时计算中
-
常见的无穷数据集有哪些?
用户行为数据,即,用户与客户端的实时交互数据
- 应用实时产生的log
- 金融股票市场的实时交易记录
-
数据运算模型
流式
- 只要数据一直产生,计算就持续的进行
批处理
可以处理有界的数据集,也可处理无界的数据集,简单来说,批流两种方式都可以
上面三张图转自 云邪 成都站 《Flink 技术介绍与未来展望》,侵删。