Ubuntu14.04安装Hadoop2.5.2(伪分布模式)
来源:互联网 发布:涿州市知新培训学校 编辑:程序博客网 时间:2024/05/20 06:29
Hadoop也可以运行在一个伪分布模式,每个Hadoop守护进程运行在一个单独的Java程序的一个节点。
伪分布模式需要在单机模式基础上进行配置。
在/software/hadoop/etc/hadoop/ 目录下
core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml等文件。
下面对以上文件进行配置。
一、etc/hadoop/core-site.xml
包含了hadoop启动时的配置信息。
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property></configuration>
二、etc/hadoop/hdfs-site.xml
用来配置集群中每台主机都可用,指定主机上作为namenode和datanode的目录。
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property></configuration>
三、etc/hadoop/mapred-site.xml
默认情况下,/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件,我们要复制该文件,并命名为mapred.xml,该文件用于指定MapReduce使用的框架
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property></configuration>
四、etc/hadoop/yarn-site.xml
包含了MapReduce启动时的配置信息。
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property></configuration>
五、格式化hdfs
hdfs namenode -format
只需要执行一次即可,如果在hadoop已经使用后再次执行,会清除掉hdfs上的所有数据。
六、启动Hadoop
经过上文所描述配置和操作后,下面就可以启动这个单节点的集群
执行启动命令:
sbin/start-dfs.sh
执行该命令时,如果有yes /no提示,输入yes,回车即可。
接下来,执行:
sbin/start-yarn.sh
执行完这两个命令后,Hadoop会启动并运行。
执行 jps
命令,会看到Hadoop相关的进程。
浏览器打开 http://localhost:50070/,会看到hdfs管理页面。
浏览器打开 http://localhost:8088,会看到hadoop进程管理页面。
七、WordCount验证
dfs上创建input目录
bin/hadoop fs -mkdir -p input
把hadoop目录下的README.txt拷贝到dfs新建的input里
hadoop fs -copyFromLocal README.txt input
运行WordCount
hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.5.2-sources.jar org.apache.hadoop.examples.WordCount input output
执行过程:
运行完毕后,查看单词统计结果
hadoop fs -cat output/*
- Ubuntu14.04安装Hadoop2.5.2(伪分布模式)
- Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
- Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
- Ubuntu14.04下安装Hadoop2.4.0 --- 伪分布模式
- Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
- Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
- Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
- 二、Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
- 二、Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
- Hadoop2伪分布模式安装
- Hadoop2安装-伪分布模式
- Ubuntu 14.04安装Hadoop2.5.2(伪分布模式)
- Ubuntu14.0.4下部署Hadoop2.7.2伪分布模式
- hadoop2.6.4+Ubuntu14.04的单机模式和伪分布模式环境搭建
- 64位Ubuntu14.04下安装hadoop2.6单机配置和伪分布配置详解
- Ubuntu14.04安装Hadoop2.5.2(单机模式)
- hadoop2.2.0伪分布安装
- hadoop2.X 伪分布安装
- jsp页面中拆分值的方式
- 使用物理引擎进行碰撞检测
- 欢迎使用CSDN-markdown编辑器
- nginx做301重定向if判断报错unknown directive "if($host!="
- 结合量价持仓分析的股指期货日内交易策略
- Ubuntu14.04安装Hadoop2.5.2(伪分布模式)
- 常用目录函数,几目录工具函数
- 四层和七层负载均衡的区别
- IOS block编程指南 5 Block和变量
- 用oracle写的二分算法
- 乘法表
- ios视图刷新问题
- Sqlite 表名或字段名与关键字重名的解决方法
- 文字