mr任务之从多个Hbase表中读取数据进行处理
来源:互联网 发布:java 数据类型 double 编辑:程序博客网 时间:2024/06/05 19:57
从两个不同的Hbase表中读取数据:
在reduce中根据数据结构 判断数据是来源于那个Hbase表即可
// 设置查询条件List<Scan> scans = new ArrayList<Scan>();Scan scan1 = new Scan();scan1.setCaching(100);scan1.setCacheBlocks(false);scan1.setAttribute(Scan.SCAN_ATTRIBUTES_TABLE_NAME, inTable.getBytes());scans.add(scan1);Scan scan2 = new Scan();scan2.setCaching(100);scan2.setCacheBlocks(false);scan2.setAttribute(Scan.SCAN_ATTRIBUTES_TABLE_NAME, inPhoneImsiTable.getBytes());scans.add(scan2);try {Job job=new Job(conf);job.setJobName("HistoryDataPhonetoImsiTasker");job.setInputFormatClass(MultiTableInputFormat.class);TableMapReduceUtil.initTableMapperJob(scans, ReadHbaseMapper.class, Text.class,Result.class, job);TableMapReduceUtil.initTableReducerJob(outTable, WritetoHbaseReducer.class, job);TableMapReduceUtil.addDependencyJars(job.getConfiguration(), SortKey.class);job.setJarByClass(HistoryDataPhonetoImsiCategoryTasker.class);job.setMapOutputKeyClass(SortKey.class);job.setMapOutputValueClass(CustomOutWritable.class);job.setSortComparatorClass(SecondSortCompartor.class);job.setGroupingComparatorClass(SecondSortGroupCompartor.class);job.setPartitionerClass(SecondSortPartitioner.class);job.waitForCompletion(true);} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}
0 0
- mr任务之从多个Hbase表中读取数据进行处理
- mr任务之从多个Hbase表中读取数据进行处理
- hadoop MR从hbase中读取数据写入到hbase中
- 利用MR程序将数据从hbase中导入mysql
- MR之wc数据写入Hbase
- HBase建表高级属性,hbase应用案例看行键设计,HBase和mapreduce结合,从Hbase中读取数据、分析,写入hdfs,从hdfs中读取数据写入Hbase,协处理器和二级索引
- C#程序从Excel表格中读取数据并进行处理
- 从hbase表1中读取数据,最终结果写入到hbase表2 ,如何通过MapReduce实现 ?
- MapReduce 中如何处理HBase中的数据?如何读取HBase数据给Map?如何将结果存储到HBase中?
- MapReduce 中如何处理HBase中的数据?如何读取HBase数据给Map?如何将结果存储到HBase中?
- MapReduce 中如何处理HBase中的数据?如何读取HBase数据给Map?如何将结果存储到HBase中?
- MapReduce 中如何处理HBase中的数据?如何读取HBase数据给Map?如何将结果存储到HBase中?
- 通过MR读数据,往Hbase中写数据
- hbase 下mapreduce 读取hbase中数据
- HBase之BlockCache数据读取
- HBase之BlockCache数据读取
- 十六周任务一之从文件中读取工资
- spark将数据写入hbase以及从hbase读取数据
- centos6.4 rpm mysql安装步骤
- sqlserver 日常检查脚本
- java设计模式之单例模式
- C语言实现组合数学 邻位互换生成算法
- Linux 系统下MySQL忘记root密码解决办法
- mr任务之从多个Hbase表中读取数据进行处理
- 多线程的单元测试
- mysql的远程数据库连接
- Apache 关于 mod_rewrite 遇到 %2F或%5C (正反斜杠)等特殊符号导致URL重写失效出现404的问题
- 如何实现全选按钮和多选按钮
- inet_pton()函数,编译运行提示段错误
- C/ C++字符串的各种转换
- Hbase访问方式之Mapreduce
- INIT_WORK和INIT_DELAYED_WORK详解