基础参数
-- 设置任务的名称
set mapred.job.name=xxxx;
调优参数
-- 关闭 map 端 group by 预聚合
set hive.map.aggr=false;
-- 开启并行,默认值为:false,Added In: Hive 0.5.0
set hive.exec.parallel=true;
-- 上面的参数开启之后,最大并发默认为 8
hive.exec.parallel.thread.number=16
JVM
-- map 端
set mapreduce.map.java.opts=-Xmx2048M;
set mapreduce.map.memory.mb=3072;