Hadoop2.5.2学习02--MR执行环境的类型
来源:互联网 发布:国际城市三字代码 数据 编辑:程序博客网 时间:2024/05/16 08:43
System.setProperty(“HADOOP_USER_NAME”, “chb”);
1、MR执行环境有两种:本地测试环境,服务器环境
本地测试环境(windows):
在windows的hadoop目录bin目录有一个winutils.exe1、在windows下配置hadoop的环境变量2、拷贝debug工具(winutils.ext)到HADOOP_HOME/bin3、修改hadoop的源码 ,注意:确保项目的lib需要真实安装的jdk的lib4、MR调用的代码需要改变: a、src不能有服务器的hadoop配置文件 b、在调用是使用: Configuration config = new Configuration(); config.set("fs.defaultFS", "hdfs://TEST:9000"); config.set("yarn.resourcemanager.hostname", "TEST");
服务器环境:
首先需要在src下放置服务器上的hadoop配置文件
1、在本地直接调用,执行过程在服务器上(真正企业运行环境)
- a、把MR程序打包(jar),直接放到本地
- b、修改hadoop的源码 ,注意:确保项目的lib需要真实安装的jdk的lib
- c、增加一个属性:
config.set(“mapred.jar”, “C:\Users\Administrator\Desktop\wc.jar”); - d、本地执行main方法,servlet调用MR。
2、直接在服务器上,使用命令的方式调用,执行过程也在服务器上
- a、把MR程序打包(jar),传送到服务器上
- b、通过: hadoop jar jar路径 类的全限定名
看参考上篇文章 Hadoop2.5.2学习01–mapreduce统计单词数
a,1 b,1
a,3 c,3
a,2 d,2
a,3 c,3
a,2 d,2
a,1 b,1
0 0
- Hadoop2.5.2学习02--MR执行环境的类型
- hadoop2.5.2学习12-MR之PageRank
- hadoop2.5.2学习12-MR之PageRank01
- hadoop2.5.2学习12-MR之PageRank02
- MR执行环境
- hadoop2.5.2学习13-MR之新浪微博-DF的实现
- hadoop2.5.2学习10--MR之统计每月最高三个温度02
- hadoop2.5.2学习14--MR之协同过滤天猫推荐算法实现02
- hadoop2.5.2学习11-MR之好友推荐1
- hadoop2.5.2学习11-MR之好友推荐2
- hortonworks sanbox搭建hadoop2的学习环境
- hadoop2.5.2学习09--MR之统计每月最高三个温度
- hadoop2.5.2学习10--MR之统计每月最高三个温度01
- hadoop2.5.2学习13-MR之新浪微博TF-IDF算法简介
- hadoop2.5.2学习14--MR之协同过滤天猫推荐
- hadoop2.5.2学习14--MR之协同过滤天猫推荐算法实现01
- Could not locate executable null 解决办法【在windows环境下开发hadoop2.4.1或者hadoop2.5.2的mapreduce,执行job遇到的一些错误】
- 搭建Hadoop2.5.2环境
- 勿忘初心 方得始终
- java流程控制
- tkinter的应用
- 递归解决非布拉茨数列
- 稻香
- Hadoop2.5.2学习02--MR执行环境的类型
- ubuntu opencv3.2安装测试
- hawq4 查询慢
- php面向对象视频笔记之第四章(接口与多态)
- 特殊的数字
- iOS - runtime快速归解档
- 星星树
- 模拟实现Android的Handler
- Ubuntu16.04LTS安装zsh+oh-my-zsh+autojump