1、数据仓库
2、Hive的基本概念
hive就是数据仓库的管理工具,通俗的讲:hive就是将sql转化为mapreduce:
eg:select * from 。。。。。
hive就会自动将该sql转化为mapreduce,比如哪个字段作为k2,哪个作为v2
等等。。。
HQL就是类SQL,是类似于SQL的语言,不是SQL
3、Hive的基本操作
3.1、数据库操作
3.2、数据库表操作
其中一些说明解释:
partitioned by:分区,和mapreduce中的分区不一样,这里是分目录
clustered by:分桶,这个就类似于mapreduce中的分区,是分文件
3.2.2、内部表的操作
Hive表字段之间的默认分隔符是:-001,键盘打不错来
也可以通过参数指定
