hive.pdf

1、数据仓库

2、Hive的基本概念

hive就是数据仓库的管理工具,通俗的讲:hive就是将sql转化为mapreduce:
eg:select * from 。。。。。
hive就会自动将该sql转化为mapreduce,比如哪个字段作为k2,哪个作为v2
等等。。。
image.png
HQL就是类SQL,是类似于SQL的语言,不是SQL

3、Hive的基本操作

3.1、数据库操作

3.2、数据库表操作

其中一些说明解释:
partitioned by:分区,和mapreduce中的分区不一样,这里是分目录
clustered by:分桶,这个就类似于mapreduce中的分区,是分文件

3.2.2、内部表的操作

Hive表字段之间的默认分隔符是:-001,键盘打不错来
也可以通过参数指定

3.2.3、外部表的操作