一、参数优化

资源配置相关参数

mapreduce推测机制
hadoop官网可查看默认配置文件

二、修改YarnRunner源码本地提交mr到Yarn

再项目中创建一个与hadoop包名称相同的package包
修改YarnRunner源码
修改代码,配置Yarn的信息
打成一个jar包,放在本地,代码中指定路径

三、全局计数器

四、多job串联

五、mapreduce数据压缩