- 静态表和动态表的区别
- 动需要开启两个配置(Nostrict、true)
- 动 select 中必要查分区
- 动态分区条数必须大于0室才会创建 静态为0也会创建
- 严格模型有哪些限制?
- 必须要精确到分区
- order by 后加limit
- 笛卡尔积 (where条件是否可以转化为on条件)
- 分区和分桶的区别
- 从表现形式上:
- 分区:目录 分桶:文件
- 创建语句
- 分区表使用partitioned by 子句指定,指定字段为伪列,需要指定字段类型
- 分桶表由clustered by 子句指定,指定字段为真实字段,需要指定桶的个数
- 抽样语句
- tablesample(bucket x out of y)
- 形式上
- 分区表的分区个数可以增长,分桶表一旦指定,不能再增长
- 作用
- 分区避免全表扫描,根据分区列查询指定目录提高查询速度
- 分桶保存分桶查询结果的分桶结构(数据已经按照分桶字段进行了hash散列)
- 分桶表数据进行抽样和JOIN时可以提高MR程序效率
- 从表现形式上: