概述
三次信息化浪潮
技术支撑:
存储设备容量不断增加、CPU处理能力大幅提升、网络带宽不断增加
数据生产方式的变革
4V
大量化、快速化、多样化、价值化(价值密度低)
影响
在思维方式方面,大数据完全颠覆了传统的思维方式,全样而非抽样、效率而非精确、相关而非因果
两大核心技术
与云计算、物联网概念的区别
Hadoop
特性
架构和组件
HDFS
块
主要组件
NameNode
多副本冗余数据
三副本数据的存放策略
SecondaryName的冷备份作用
数据读取过程
数据写入过程
Hbase
为什么需要HBase
Hbase与传统关系数据库的区别
数据模型
主要组件
三层结构和Region的定位
系统架构
Region服务器原理
数据写入过程
缓存刷新
store的合并与分裂
HLog的作用
二级索引构建
Hindex方式
Redis+Hbase方式
Hbase+Solr方式
NOSQL数据库
兴起原因
与关系数据库的对比
四大类型数据库
理论基础
CAP