Hadoop入门(1)

来源:互联网 发布:翻卦掌诀推算法 编辑:程序博客网 时间:2024/05/20 17:42
几天前开始学习hadoop,从今天起,想把我学习hadoop全过程记录一下。我会记录在学习过程中碰到的问题、困难以及解决方法等等,如果你也是刚学hadoop,我们可以一起讨论。

学了几天,好像入门了,在这里和大家分享,就当全程笔记的第一篇吧。

新说明一下我的开发环境

操作系统:在windows下使用wubi安装了ubuntu 10.10
hadoop版本:hadoop-0.20

Hadoop 快速入门文档:http://hadoop.apache.org/common/docs/r0.18.2/cn/quickstart.html

上面这个地址是最新hadoop快速入门,基本上按照里面步骤能快速入门hadoop,但这篇文档是针对hadoop 0.18写的,有些地方还是和hadoop 0.20不同。在文档“伪分布式模式的操作方法”中有下面配置说明:

Java代码  收藏代码
  1. 配置  
  2. 使用如下的 conf/hadoop-site.xml:  
  3.   
  4. <configuration>  
  5.   <property>  
  6.     <name>fs.default.name</name>  
  7.     <value>localhost:9000</value>  
  8.   </property>  
  9.   <property>  
  10.     <name>mapred.job.tracker</name>  
  11.     <value>localhost:9001</value>  
  12.   </property>  
  13.   <property>  
  14.     <name>dfs.replication</name>  
  15.     <value>1</value>  
  16.   </property>  
  17. </configuration>  


在这里,你会发现在hadoop 0.20中并不存在conf/hadoop-site.xml文件,所以,如果你使用高版本的hadoop就要修改为下面的配置:
Java代码  收藏代码
  1. 配置  
  2. 使用如下的 conf/core-site.xml:  
  3.   
  4. <configuration>  
  5.   <property>  
  6.     <name>fs.default.name</name>  
  7.     <value>hdfs://localhost:9000</value>  
  8.   </property>  
  9. </configuration>  

Java代码  收藏代码
  1. 配置  
  2. 使用如下的 conf/hdfs-site.xml:  
  3.   
  4. <configuration>  
  5.   <property>  
  6.     <name>dfs.replication</name>  
  7.     <value>1</value>  
  8.   </property>  
  9. </configuration>  



Java代码  收藏代码
  1. 配置  
  2. 使用如下的 conf/mapred-site.xml:  
  3.   
  4. <configuration>  
  5.   <property>  
  6.     <name>mapred.job.tracker</name>  
  7.     <value>localhost:9001</value>  
  8.   </property>  
  9. </configuration>  


只要在这里注意一下,再按照“hadoop快速入门”文档就能对hadoop快速入们了。

原创粉丝点击