hadoop 入门 启动任务
来源:互联网 发布:子域名挖掘机 编辑:程序博客网 时间:2024/05/17 06:09
定义框架接口
由具体实现类实现
ToolRunner
同一的入口调用
按配置解析参数,调用接口方法
Mahout 中具体调用示例
覆盖方法,提取参数,调用核心方法
核心方法,配置job,开始map reduce任务
由具体实现类实现
- public interface Tool extends Configurable {
- int run(String [] args) throws Exception;
- }
ToolRunner
同一的入口调用
按配置解析参数,调用接口方法
- public static int run(Configuration conf, Tool tool, String[] args)
- throws Exception{
- if(conf == null) {
- conf = new Configuration();
- }
- GenericOptionsParser parser = new GenericOptionsParser(conf, args);
- //set the configuration back, so that Tool can configure itself
- tool.setConf(conf);
- //get the args w/o generic hadoop args
- String[] toolArgs = parser.getRemainingArgs();
- return tool.run(toolArgs);
- }
Mahout 中具体调用示例
- public static void main(String[] args) throws Exception {
- ToolRunner.run(new Configuration(), new MinHashDriver(), args);
- }
覆盖方法,提取参数,调用核心方法
- @Override
- public int run(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
- addInputOption();
- addOutputOption();
- //...........
- runJob(input,
- output,
- minClusterSize,
- minVectorSize,
- hashType,
- numHashFunctions,
- keyGroups,
- numReduceTasks,
- debugOutput);
- return 0;
- }
核心方法,配置job,开始map reduce任务
- private void runJob(Path input,
- Path output,
- int minClusterSize,
- int minVectorSize,
- String hashType,
- int numHashFunctions,
- int keyGroups,
- int numReduceTasks,
- boolean debugOutput) throws IOException, ClassNotFoundException, InterruptedException {
- Configuration conf = getConf();
- //配置参数设置........................
- Job job = new Job(conf, "MinHash Clustering");
- job.setJarByClass(MinHashDriver.class);
- //Job参数设置.........................
- job.waitForCompletion(true);
- }
0 0
- hadoop 入门 启动任务
- hadoop入门-查看启动脚本
- Hadoop 任务调度分析启动篇
- Hadoop MapReduce之任务启动(一)
- Hadoop MapReduce之任务启动(二)
- Hadoop MapReduce任务的启动分析
- hadoop2.x入门:Hadoop的启动方式
- Hadoop入门-1.配置部署启动(基于hadoop-2.7.3)
- 解决Hadoop运行jar包时MapReduce任务启动前OutOfMemoryError:Java heap space问题
- Hadoop入门
- Hadoop 入门
- Hadoop入门
- hadoop入门
- Hadoop入门
- hadoop入门
- Hadoop入门
- Hadoop入门
- Hadoop 入门
- akoj-1142-同构词
- Apple Watch系列二:UI元素
- 第7周 热身(3)
- 点9图做法
- hibernate连接mysql示范
- hadoop 入门 启动任务
- 记录centos安装tp-link WN821N驱动
- java使用Volatile
- PHP文件上传路径
- 【数位DP】【hdu 3943】K-th Nya Number
- 下拉菜单 DIV+CSS
- 串口中fifo的作用
- Mongodb修改列的数据类型
- android:TableLayout 布局详解