hadoop自定义分区
来源:互联网 发布:淘宝客怎么关闭掉 编辑:程序博客网 时间:2024/06/18 16:29
- 实现自定义分区比较简单了,继承Partitioner,实现getPartition()方法就行了,分区是按照key进行的。以wordcount为例。
- 输入文本1 hello world hello
3.输入文本2 hello world world
4 编写程序,hello 和world各自为一个分区,各自对应一个reduce,对应一个输出文件。
public class MyPatitioner extends Partitioner<Text, LongWritable>{ @Override public int getPartition(Text key, LongWritable value, int numPartitions) { // TODO Auto-generated method stub if (key.toString().equals("hello")) { return 0; //从0开始 }else { return 1; } }}
5.运行程序中加入以下两行代码
job.setPartitionerClass(MyPatitioner.class); //设置分区类 job.setNumReduceTasks(2); //设置分区个数
6.运行结果
hello 3
world 3
0 0
- Hadoop自定义分区Partitioner
- hadoop自定义分区函数
- hadoop自定义分区
- Hadoop 自定义排序,自定义分区,自定义分组
- Hadoop mapreduce自定义分区HashPartitioner
- hadoop自定义分区操作(Partitioner) 步骤1.3
- Hadoop学习笔记(十)---自定义分区
- Hadoop中自定义排序,分区,分组
- hadoop 序列化和排序,自定义分区
- hadoop-分区
- hadoop编程小技巧(3)---自定义分区类Partitioner
- 在hadoop作业中自定义分区和归约
- Hadoop 笔记之创建自定义分区---手机流量统计
- 学习Hadoop第十四课(自定义分区Partitioner)
- hadoop自定义排序、分组、分区(温度统计)
- Hadoop系列学习–Partitioner内置分区与Partitioner自定义分区
- hadoop中的Partitioner分区
- hadoop中的Partitioner分区
- ThinkPHP5 select出来的结果是个对象?居然还可以以数组形式访问数据?
- 手写数字识别系统编程技巧
- “谈一谈网络编程学习经验“总结
- MySQL简单实例
- 【Unity优化】为C#定制联合(Union)提高序列化速度
- hadoop自定义分区
- Codeforces 688E The Values You Can Make【Dp】
- springmvc知识点总结
- Android 性能优化之布局优化
- ruby语法条件语句实例
- 最简单快速的Apache二级域名实现方法介绍
- 解决ScrollView嵌套ListView和GridView冲突
- java数据存储及读取的几种常用方法
- Myeclipse2013破解方法