win8/win10+Hadoop2.8.1+jdk1.8部署(无需cygwin)

来源:互联网 发布:http的默认端口 编辑:程序博客网 时间:2024/06/07 22:31

最近学校里团队要做一个项目,需要学习Hadoop相关知识,先来部署一下。

部署的时候在网上找了很多参考的文章,但是发现有不少都是有错的,逐渐踩坑爬出坑

请一定要!按照步骤!一步步!准确的!百分之百的!配置你的文件


部署前提:


1. jdk1.8,环境变量要配置好


2. Hadoop2.8.1 直接从官网下载即可 官网下载链接:点击打开链接

 10月3号刚出了3.0.0 beta版本。。就在我部署完的后几天。。


3. 我自己电脑是win8,后来发现帮同学(win10)部署的时候,也可以,成功了。




一、windows下的路径配置:


1.在环境变量中配置HADOOP_HOME路径


右键这台电脑->属性->高级系统设置->环境变量

在系统变量中新建一个变量名为HADOOP_HOME 变量值设为自己的hadoop安装目录下的bin目录路径



2. 配置hadoop的bin目录路径



二、Hadoop配置


在配置之前,要先用这个压缩包里的文件取代你原来在官网上下的对应文件夹 链接: https://pan.baidu.com/s/1hsvixJA 密码: q42i

然后再对配置文件进行以下修改

(文件来自于TooDey的博主Tushar Sarde)


1.编辑core-site.xml文件

<configuration><property>       <name>fs.defaultFS</name>       <value>hdfs://localhost:9000</value>   </property></configuration>

2.编辑mapred-site.xml文件

<configuration>   <property>       <name>mapreduce.framework.name</name>       <value>yarn</value>   </property></configuration>

3.编辑hdfs-site.xml文件

<configuration><property>       <name>dfs.replication</name>       <value>1</value>   </property>   <property>       <name>dfs.namenode.name.dir</name>       <value>/f:/Hortanwork/1gbhadoopram/Software/hadoop-2.7/hadoop-2.7.1/data/namenode</value>   </property>   <property>       <name>dfs.datanode.data.dir</name>     <value>/f:/Hortanwork/1gbhadoopram/Software/hadoop-2.7/hadoop-2.7.1/data/datanode</value>   </property></configuration>

4.编辑yarn-site.xml文件

<configuration>   <property>       <name>yarn.nodemanager.aux-services</name>       <value>mapreduce_shuffle</value>   </property>   <property>       <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>       <value>org.apache.hadoop.mapred.ShuffleHandler</value>   </property></configuration>


5.编辑hadoop-env.cmd文件


在set JAVA_HOME=后面加上自己的jdk路径 注意:如果jdk路径中包含空格,要用8.3短名支持Program Files的空格,我的路径就是有空格,用PROGRA~1代替



三、Hadoop开启服务


OK~恭喜你走到了这一步,如果你完全按照上面的步骤进行,配置应该是比较顺利的,接下来我们要开启Hadoop服务!


1. 以管理员身份运行cmd


   在你的hadoop/bin目录下运行:hdfs namenode -format

如果是再次format的话会有提示选择Y/N 选择Y就行。



2. 切换到sbin目录下运行:


start-all.cmd会启动所有服务,如果成功了,接下来会跳出一个个cmd窗口



3. 使用jps命令可以查看当前运行的服务




如果如图所示,那么恭喜你,Hadoop启动成功了!

对了,这里说一下,也许有同学会问为什么没有JobTracker,TaskTracker的进程,Hadoop是2.x以后就没有这两个进程了,这是开发人员对Hadoop进行升级修改的原因,取而代之的是yarn。


4. 打开Resourcemanager和Namenode info的地址


Resourcemanager -Resourcemanager


Namenode info -Namenode information



同时,参考了一些比较有用的博客,感谢博主提供的资源,在这里贴一下链接

http://toodey.com/2015/08/10/hadoop-installation-on-windows-without-cygwin-in-10-mints/


ps:CSDN上传图片实在是太痛苦了。。待我回宿舍再一个个上传(哭泣脸)

原创粉丝点击