核心概念
- Topologies
- Streams
- Spouts
- Bolts
- Tuple
- Stream groupings
- Reliability
- Tasks
- Workers
记忆:
Spout先到Bolt1和Bolt2是有顺序的,所以存在Topology。
从Spout以Tuple 的方式发送数据,在Bolt中处理我们的业务逻辑,针对Tuple针对处理。
整个流程都开发完了,需要统一的调度,所以就有了Topology
核心概念总结
- Topology:计算拓扑,由spout和bolt组成的
- Stream:消息流 ,抽象概念,没有边界的tuple构成
- Tuple:消息/数据 传递的基本单元
- Spout:消息流的源头,Topology的消息生产者,可以有多个
- Bolt:消息处理单元,可以做过滤、聚合、查询/写数据库的操作,业务逻辑在此操作。