推荐一些Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。
一、学习路线图
二、编程实践
- Hadoop历史版本安装
- 用Maven构建Hadoop项目
- Hadoop编程调用HDFS
- 用Maven构建Mahout项目
- Mahout推荐算法API详解
- 用MapReduce实现矩阵乘法
- 从源代码剖析Mahout推荐引擎
- Mahout分步式程序开发 基于物品的协同过滤ItemCF
- Mahout分步式程序开发 聚类Kmeans
- PageRank算法并行实现
三、案例分析
—————-2017年1月更新——-