简介:大数据时代已经到来,越来越多的行业面临着大量数据需要存储以及分析的挑战。Hadoop,作为一个开源的分布式并行处理平台,以其高扩展、高效率、高可靠等优点,得到越来越广泛的应用。本课旨在培养学员理解Hadoop的架构设计以及掌握Hadoop的运用能力。
第1章 初识Hadoop
本章讲述课程大纲,授课内容,授课目标、预备知识等等,介绍Hadoop的前世今生,功能与优势
- 1-1 Hadoop大数据平台架构与实践课程简介 (04:06)
- 1-2 Hadoop的前世今生 (04:44)
- 1-3 Hadoop的功能与优势 (03:30)
- 1-4 Hadoop生态系统及版本 (02:39)
第2章 Hadoop安装
本章通过案例的方式,介绍Hadoop的安装过程,以及如何管理和配置Hadoop
- 2-1 Hadoop安装-获取linux操作系统 (05:02)
- 2-2 Hadoop安装-安装JDK (03:27)
- 2-3 Hadoop安装-配置hadoop (07:14)
- 2-4 安装小结 (03:19)
第3章 Hadoop的核心-HDFS简介
本章重点讲解Hadoop的组成部分HDFS的体系结构、读写流程,系统特点和HDFS的使用。
- 3-1 HDFS基本概念 (02:23)
- 3-2 数据管理策略 (02:50)
- 3-3 HDFS中文件的读写操作 (02:46)
- 3-4 HDFS特点 (01:44)
- 3-5 HDFS使用 (04:22)
第4章 Hadoop的核心-MapReduce原理与实现
本章介绍MapReduce的原理,MapReduce的运行流程,最后介绍一个经典的示例WordCount
第5章 开发Hadoop应用程序
本章介绍在Hadoop下开发应用程序,涉及多个典型应用,包括数据去重,数据排序和字符串查找。