基础参数
-- 设置任务的名称set mapred.job.name=xxxx;
调优参数
-- 关闭 map 端 group by 预聚合set hive.map.aggr=false;
-- 开启并行,默认值为:false,Added In: Hive 0.5.0set hive.exec.parallel=true;-- 上面的参数开启之后,最大并发默认为 8hive.exec.parallel.thread.number=16
JVM
-- map 端set mapreduce.map.java.opts=-Xmx2048M;set mapreduce.map.memory.mb=3072;
