partitoner笔记

来源:互联网 发布:类似p2p的软件 编辑:程序博客网 时间:2024/05/01 15:29
//1.3 指定分区类job.setPartitionerClass(KpiPartitioner.class);job.setNumReduceTasks(3);
static class KpiPartitioner extends HashPartitioner<Text, KpiWritable>{@Overridepublic int getPartition(Text key, KpiWritable value, int numReduceTasks) {if(key.toString().length()==11){return 0;}else if(key.toString().length()==10){return 1;}else{return 2;}}}

 分区的例子必须打成jar运行

    job.setJarByClass(KpiApp.class);


 用处:    1.根据业务需要,产生多个输出文件

                    2.多个reduce任务在运行,提高整体job的运行效率


1.Partitioner是partitioner的基类,如果需要定制partitioner也需要继承该类。

2.  HashPartitioner是mapreduce的默认partitioner。计算方法是

which reducer=(key.hashCode() &Integer.MAX_VALUE) % numReduceTasks,得到当前的目的reducer。




0 0