JobClient应用概述

来源:互联网 发布:java beans 编辑:程序博客网 时间:2024/05/29 05:14

一、应用背景

由于在设计中有一个模块是对Job的管理,所以,在这里我采用了JobClinet来进行简单的控制。

二、应用点

JobClient指的是org.apache.hadoop.mapred.JobClient这个类。里面有不少的方法,我这里列举一些我用到的和一些需要注意的方法。

1、JobClient的实例化。这里有2中方法,一种是new JobClient(new JobConf);另外一种是实例化IP地址和端口。

2、通过JobClient获取Job列表。

JobClient.jobsToComplete()返回没有完成和没有失败的Job。换句话说就是在运行的Job。

JobClient.getAllJobs()返回所有的Job,不管是失败还是成功的。

3、获取JobID

JobID是一个Job的唯一标识,如果要获取指定的JobID,那么需要有根据,例如UserName。我这里是通过User来获取JobID。方法是遍历Job,然后找到名称相匹配的Job,然后取出ID。

4、通过线程阻塞的模式来等待Job执行完成。

JobClient.getJob(JobID).waitForCompletion();

三、总结

1、JobClient的应用很简单,总的说来就那么几种,细致看一下API就会大部分的应用。

2、通过JobClient还可以对task进行监控,也可以获取Job的进度百分比。

3、写的比较简单,写的不对或是有疑问可以发邮件dajuezhao@gmail.com

原创粉丝点击