hadoop自定义分区

来源：互联网发布：淘宝客怎么关闭掉编辑：程序博客网时间：2024/06/18 16:29

实现自定义分区比较简单了，继承Partitioner，实现getPartition()方法就行了，分区是按照key进行的。以wordcount为例。
输入文本1 hello world hello
3.输入文本2 hello world world
4 编写程序，hello 和world各自为一个分区，各自对应一个reduce,对应一个输出文件。

public class MyPatitioner extends Partitioner<Text, LongWritable>{    @Override    public int getPartition(Text key, LongWritable value, int numPartitions) {        // TODO Auto-generated method stub        if (key.toString().equals("hello")) {            return 0;      //从0开始        }else {            return 1;        }    }}

5.运行程序中加入以下两行代码

  job.setPartitionerClass(MyPatitioner.class);  //设置分区类  job.setNumReduceTasks(2);  //设置分区个数

6.运行结果
hello 3
world 3

0 0

Hadoop自定义分区Partitioner
hadoop自定义分区函数
hadoop自定义分区
Hadoop 自定义排序，自定义分区，自定义分组
Hadoop mapreduce自定义分区HashPartitioner
hadoop自定义分区操作(Partitioner) 步骤1.3
Hadoop学习笔记(十)---自定义分区
Hadoop中自定义排序，分区，分组
hadoop 序列化和排序，自定义分区
hadoop-分区
hadoop编程小技巧（3）---自定义分区类Partitioner
在hadoop作业中自定义分区和归约
Hadoop 笔记之创建自定义分区---手机流量统计
学习Hadoop第十四课（自定义分区Partitioner）
hadoop自定义排序、分组、分区（温度统计）
Hadoop系列学习–Partitioner内置分区与Partitioner自定义分区
hadoop中的Partitioner分区
hadoop中的Partitioner分区
ThinkPHP5 select出来的结果是个对象？居然还可以以数组形式访问数据？
手写数字识别系统编程技巧
“谈一谈网络编程学习经验“总结
MySQL简单实例
【Unity优化】为C#定制联合(Union)提高序列化速度
hadoop自定义分区
Codeforces 688E The Values You Can Make【Dp】
springmvc知识点总结
Android 性能优化之布局优化
ruby语法条件语句实例
最简单快速的Apache二级域名实现方法介绍
解决ScrollView嵌套ListView和GridView冲突
java数据存储及读取的几种常用方法
Myeclipse2013破解方法