1.创建分区表

分区是大数据分治的一种思想,分区表实际上就是对应在hdfs独立文件夹,该文件夹下是该分区的所有数据文件

分区就是把不同类型的数据放到不同的类型的数据放到不同的目录下

1.创建一节分区:

  1. create table score(sid string,cid string,score int ) partition by (month string) row format delimited fields terminated by '\t';

加载数据:

  1. load data local inpath '/export/data/score..txt' into table score partition (month='202006');

2.创建多级分区:

  1. create table score(sid string,cid string,sscore int) partition by (year string,month string,day string) row format delimited fields terminated by '\t'

数据加载

  1. load data local inpath '/export/data/score.txt' into table score2 partition(year='2020',month='06',day='01');

3.查看分区:

  1. show partitions score;

4.添加分区:

  1. alter table 表名 add partition(month='202008');
  2. alter table score add partition(month='xxx');

5.删除分区:

  1. alter table score dorp partition(month='202010');