Hadoop

适合海量数据存储和计算的平台
版本：1.0
-> 2.0 新增Yarn
-> 3.0

本地模式（Local)无需运行任何的守护进程，所有程序都在同一个JVM上执行。HDFS在这种模式下，用的就是本地的文件系统
伪分布模式 Hadoop守护进程运行在本地机器上，模拟一个小规模的集群
全分布模式 Hadoop守护进程运行在一个集群

Hadoop的特点
扩容能力（Scalable）：能可靠地（reliably）存储和处理千兆字节（PB）数据。
成本低（Economical）：可以通过普通机器组成的服务器群来分发以及处理数据。这些服务器群总计可达数千个节点。
高效率（Efficient）：通过分发数据，hadoop可以在数据所在的节点上并行地（parallel）处理它们，这使得处理非常的快速。
可靠性（Reliable）：hadoop能自动地维护数据的多份副本，并且在任务失败后能自动地重新部署（redeploy）计算任务。
Hadoop的朋友圈

hadoop的三个核心
http://localhost:8088/