hadoop 2.7.3多节点集群

来源:互联网 发布:知乎帖子怎么删除 编辑:程序博客网 时间:2024/06/06 08:43

hadoop 2.7.3多节点集群

我在前面的单机的基础上,拷贝了一份虚拟机:修改了主机名和IP

前提安装和配置hadoop_env.sh与java

sudo apt-get install ssh 
sudo apt-get install rsync

发现不用拷贝ssh的公匙也能链接上另一台虚拟机,如果不能,参照SSH 无密码登录,配置公匙文件,记得确定安装了:



确认ssh 两台虚拟机能互相链接


注意一定要设置好hadoop.tmp.dir目录,并确认存在;不然不能启动nomanode


由于使用了2.7.3版本,感觉比较新,在网上搜索的答案,都比较旧版本,照着搭建总是有些问题;还是根据官方自带的文档搭建;我决定照官网文档折腾,虽然累点,但是还顺利运行起来;我也是刚开始自学,近端时间金蝶的项目,老崔都没时间学习了;一起学习的朋友有问题可以一起探讨学习:QQ522688670;建议照官方文档学习;或者先学习旧版本的,旧版本中文资料比较多,容易上手;


开始配置core-site.xml配置

这是指定文件系统主机

<configuration>    <property>        <name>fs.defaultFS</name>        <value>hdfs://localhost:9000</value>    </property></configuration>

hdfs-site.xml  路劲根据自己实际
<configuration>    <property>        <name>dfs.replication</name>        <value>1</value>    </property></configuration>
格式化namenode
hdfs namenode -format
hdfs 在hadoop/bin下;我喜欢直接输入命令;我bin目录页添加到了环境变量中
启动分布式文件系统
  start-dfs.sh
一般会有5个java进程;输入jps可查看给(jps除外)
NameNodeDataNoderesourceManagerSecondaryManagerDataNodeManger
web管理界面地址 NameNode 
http://主机ip:50070/
如果能访问到,说明没问题了




原创粉丝点击