storm和hadoop比较
数据来源:
hadoop处理的是hdfs上TB级别的数据(历史数据),storm处理的是实时新增的某一笔数据(实时数据)
处理过程:
hadoop是分map阶段到reduce阶段,storm是用户定义处理流程,流程中可以包含多个步骤,每个步骤可以是数据源(spout)或逻辑处理(bolt);
是否结束:
hadoop最后是要结束的,storm是没有结束状态,到最后一步,就停在那,直到有新数据进入时再从头开始
处理速度:
hadoop是处理HDFS上T级别数据为目的,处理速度慢,storm是只要处理某一新增数据即可,可以做的很快
使用场景:
hadoop是在要处理批量数据时使用,不讲究实时性,storm是要处理某一新增数据时用的,要讲究时效性。