hadoop常见问题汇总(一)

来源:互联网 发布:淘宝店咋开 编辑:程序博客网 时间:2024/06/06 02:49

最近在上云计算的课,于是开始学习hadoop,下面都是我在安装过程中遇到的,有些问题可以解决,有些没有解决。

首先安装hadoop过程中,一开始采用的是Ubuntu 10.04 + hadoop-1.0.2 + eclipse for java

采用Ubuntu的原因是因为安装软件比较方便。采用apt-get install就可以了,中途安装必要的openssh时快一些。

首先讲一下hadoop安装前的必要准备:

1.  Java jdk 这一步很重要,如何配置java的环境变量网上很多,这里不再赘述。但是要提醒的是版本最好是1.6,我用1.7在有些fedora 版本中安装后,不能正常执行。JAVA_HOME 一定要设好,用helloworld来测试一定做一下。Ubuntu中装的是Open版的,也是可以的,只是后面设置JAVA_HOME的时候要找对路径。

2. openssh 因为在hadoop中要用到ssh无密码登陆功能,所以需要这个小程序。如果是Ubuntu就直接apt-get install就可以了。如果是其他linux版本,可以去http://openbsd.org.ar/pub/OpenBSD/OpenSSH/portable/ 下载。./configure  后make install  。 然后就是ssh-keygen -t rsa -P ""  接着回车 再输入cat $HOME/.ssh/id_rsa.pub >> $HOME/authorized_keys 然后用ssh localhost 测试一下是不是不用输入密码就能登陆上。

3. eclipse 这只要下载相应版本就行了。后面会用到hadoop的插件才能运行Mapreduce的程序。

4. hadoop的版本。一开始用的是hadoop-1.0.2.deb版本,会自动安装,一旦安装,要是想删除有些费劲,所以建议大家一开始就装tar.gz的版本,这样版本更新更换会好用很多,环境参数也好设置。要是装多个hadoop,运行之后会可能发生冲突,很难预料,也很难解决。我就是装了两个版本导致namenode datanode secondarynamenode  jobtracker tasktracker 一个也没能启动,虽然终端显示正常开启,但是jps发现一个都没有,查log也看不出个所以然。非常痛苦!所以强烈建议新手照着教程做的时候不要乱换版本,不要用多个版本。

原创粉丝点击