简介
reduce阶段合并数据的规则,默认根据key相同的分为一组
可以自定义
groupingComparator就是reducer结束的时候对外输出的时候,
把默认根据key相同的分为一组,改为自定义
groupingComparator也是种辅助排序,他在记录到达reducer之前按键对记录排序,但是键对应的值没有被排序
写法
一般bean要定义,还要实现WritableComparable<T>
可比较,
bean中的字段是序列化字段类型,序列化字段类型好比较,
然后自定义分组,让同一个key落到同一个reducer上,
最后自定义groupingComparator,定义reducer结束对外输出的时候,这一组要怎么做?
在自定义groupingComparator中构造方法传入要比较的对象,他会按照这个比较.
也就是reducer在原来的按key分一组,改为按自定义groupingComparator中构造方法比较的分组进行分组了
比如一个reducer有多个key,reducer可以按照自定义groupingComparator定义的,分为几组